[討論] 以R軟體探討球員對球隊防守之影響力

作者: gaowolf (銀狼閃光 三日月劍)   2019-03-09 21:31:07
(知識文長請慎入)
我相信各位應該都會同意
防守的貢獻是不好量化的,特別是與進攻端相比之下
而我本篇的討論文
就是要來講講,如何以R統計軟體量化球員對球隊防守的貢獻
沒意外今年Kobe(以下簡稱為老大)與鄧肯都會進入名人堂
而他倆的防守第一隊皆入選至少八次,因此就挑他們倆為樣本
模型如下:
Y=團隊逐年防守效率(Drtg)
X=1.隊友該年是否獲得年度防守球員獎(DPOY)
2.隊友中該年DBPM最高的那個值(Teammate)
3.隊友該年獲得年度防守一隊的總次數(T.s.First.D)
4.隊友該年獲得年度防守二隊的總次數(T.s.Second.D)
5.老大該年是否入選年度防守一隊(B.s.First.D)
6.老大該年是否入選年度防守二隊(B.s.Second.D)
7.老大自己該年的DBPM(Bryant)
解釋:
1.5&6是二元變數,也就是有的話記為1,沒有的話記為0
2.探討對象為鄧肯時,5&6這兩個變數名稱會改成D.s.First.D和D.s.Second.D,7則換成D
uncan
3.老大生涯無隊友獲得DPOY或防守一隊,導致2&3這兩項變數都會一路掛零
因此他的模型會直接少兩個變數
4.同理,鄧肯的模型也是沒有DPOY這一項
兩人的數據列表如下:
鄧肯https://i.imgur.com/9U9gWxO.jpg
老大https://i.imgur.com/0kw2XMD.jpg
接著,該進入迴歸分析結果的部分了:
老大https://i.imgur.com/4ap3vGf.jpg
鄧肯https://i.imgur.com/75FSTI3.jpg
統計中,顯著的概念表示一個X變數有無實質影響力
而顯著是有程度之分的,舉例來說,1%會比5%更顯著
因此圖中的"."與"*"都是在表示顯著程度
"."=10%水準下顯著 "*"=5%水準下顯著 "**"=1%水準下顯著
若無任何符號 則代表不顯著
我們可以發現
跟鄧肯的隊友相關之四個變數裡面,有兩個顯著,甚至有一個到達0.1%的顯著水準
至於鄧肯自己相關的三個變數皆非顯著
事實上是離10%顯著水準有一大段距離
老大正好相反
他的隊友變數僅一個是10%水準顯著,程度遠遜於鄧肯的隊友變數
而老大自己的變數有一項是10%顯著
結論:
數據顯示
鄧肯對馬刺的防守貢獻<<老大對湖人的防守貢獻
鄧肯隊友影響馬刺防守的程度>>老大隊友影響馬刺防守的程度
所以老大在防守端是在罩隊友
鄧肯則是獲得明顯更多的防守支援
馬刺的團隊防守好,鄧肯的隊友貢獻其實不比鄧肯少
辛苦程度上老大明顯更加艱辛
作者: JimmyRollins (J-Ro)   2019-03-09 21:55:00
部長好久不見XD
作者: BernieWisman (巴尼)   2019-03-09 21:59:00
比較不懂的是為啥標題要強調R軟體 只是要跑迴歸連excel都能做
作者: proPenciLead (黑長直控)   2019-03-09 22:27:00
高狼給尊重
作者: alan15161718 (曾柏)   2019-03-09 22:50:00
要不要重修研究法

Links booklink

Contact Us: admin [ a t ] ucptt.com