[討論] 球員進攻選擇跟獲得罰球數的相關性

作者: henry87927 (Sunshine)   2023-05-05 01:45:07
→ ratzeial: 那你要不要順便看一下場均罰球高的球員出手距離跟罰球,跟你的公式有沒
有match?
問得好!
最喜歡這種想要進行學(筆)術(戰)交流的朋友了!
我們先不要把範圍限縮在場均高罰球次數的球員上,我首先比較好奇的是這個「出手距離跟
獲得罰球」的相關性,如果再細分到一個一個球員上,會不會也成立呢?
首先,如果是用所有球員(我們算有出賽超過20場的)例行賽的數據去比較,那會長這樣:
https://i.imgur.com/21BoZjf.png
欸怎麼變正相關?因為會有一堆低出手數低罰球數的球員堆在左下角那邊,整個分析就沒意
義了。
所以找出「場均出手多少次以上的球員才是有參考價值的樣本」就很重要了。
這邊歡迎各位版友提出更好的方法,我自己是用了帕雷托法則(就是鼎鼎大名的80/20法則
)去做假設。
為了讓文理組都不得罪,這邊解釋一下80/20法則。大致上的意思是說80%的結果,都是源自
20% 的成因。
換句話說,小比例的原因就能帶來結果帶來巨大的影響。比如公司80%的營收大多來自前20%
的客戶、國家80%的GDP來自前20%的企業等等。
上NBA版還能學統計學,想不到吧。
回到主題,NBA的出手次數雖然沒有集中到80/20,但70/30卻是有的。
本季例行賽,NBA官網登錄539名球員,全聯盟出手了217220次。
而出手次數前30%的球員(前162名)的加總出手數是142926次,佔了全NBA的出手數的66%。
所以拿出手次數前30%的球員作為樣本,來比較「球員出手距離跟獲得罰球數量」的相關性
,應該很有代表意義了吧:
https://i.imgur.com/HeDrGir.png
嗯…還是正相關,我想了一下,發現我忽略了一個簡單的事實:
「越常出手的球員,本來就越容易有罰球啊。」
所以我再用這前30%的球員資料比較了場均出手數跟罰球數的關係:
https://i.imgur.com/peXXGwp.png
果然有夠相關。
但仔細觀察圖表之後,發現隨著出手次數的增加,資料點開始逐漸發散,尤其以出手數15次
附近為分水嶺。
場均出手15次以上的「罰球數跟出手次數」相關性減弱了。代表有其他的變數在影響這個相
關性。
那我們把場均出手15次以上的數據(其實是14.7次以上因為我想把Poole也擺進來XD)拿來
比較,於是就得到了這張圖:
https://i.imgur.com/NiJvay2.png
能場均出手14.7次以上,應該可以說是各隊主力球員(共58位),大家應該都認得就加了名
字上去。
順手標了幾個大家會感興趣的球員給大家當吵架素材,請珍惜帳號。
所以分析完數據之後下個結論:
1. 出手次數越多,就越有拿到罰球的機會(廢話
2. 球隊「主力球員」的攻擊選擇,則會受到出手距離的影響。出手距離越遠,得到的罰球
數越少。
有不少推文有提到相關係數太低的問題,的確這篇拿來當論文應該會被教授洗臉洗到翻過去

與罰球多寡有相關性的變數應該非常多,之後有空的話打算再抓多點數據做多變量分析。
這篇就當拋一個想法給大家討論,研究方式不嚴謹請見諒。
也附上這篇跟上一篇回歸線公式的比較:
上一篇回歸線:
https://i.imgur.com/IjizhdM.png
這一篇回歸線:
https://i.imgur.com/TIc7CZx.png
上一篇推文有人說要附上P value證明顯著性,好啦都來啦:
https://i.imgur.com/XD5l4jZ.png
最後應你要求,「順便看一下場均罰球高的球員出手距離跟罰球,跟你的公式有沒有match?

我就抓場均最高的10位球員,自己看:
https://i.imgur.com/kLnrWhu.png
商科算文組的話我文理組都待過啦。大家聊球就好。不要亂開戰場:)
以上一點小分享,感謝大家。有看到推文說想看太陽46罰的分析,要是最後西決湖人打太陽
我就做XD
數據都這裡抓的,有興趣歡迎各位多多利用[Teams Traditional | Stats | NBA.com](http
s://www.nba.com/stats/teams/traditional?SeasonType=Regular+Season)
作者: badangel0000 (紅茶犬)   2023-05-05 05:43:00
簡單的事實 本來就不用理那個悲憤宅 超逗
作者: baller0allen (Lo que paso paso..)   2023-05-05 07:18:00
結論就是沒有結論,數據太離散我知道basketballstate 可以抓到 出手形態,可以以出手形態為主做分析 可能比出手距離有用還可以加入柴犬的影響(每個柴犬整場比賽吹罰的數量與平均吹罰的偏離正負差)
作者: Dickys200092 (Dickys)   2023-05-05 07:25:00
有解決內生問題給推
作者: skywings1984 (空翼1984)   2023-05-05 08:11:00
認真!專業 !
作者: Presentation (代表)   2023-05-05 08:29:00
你的相關係數0.1太低,表示兩個變數是低度線性相關,另外xy的比例差異過大,導致你覺得線畫起來很有相關,實際上兩個軸的scale拉到一樣的話,回歸線應該幾乎是水平線了這種大學基礎統計學的回歸章節功課,圖跟數據解釋成這樣,要怎麼給推?推文不就說了,結論的正相關(出手距離、罰球數)數據的相關係數只有0.1,表示低度線性相關,至於圖為什麼看起來正相關是因為xy 軸的scale 差異過大,如果調整scale,圖看起來應該會接近水平線,就不會覺得很正相關了我還正好真的是統計碩士呢,已經回覆的推文我想不必再爭論下去,原po 也已經知道自己的結論過於粗糙,等看看他修正後的文再說吧
作者: gamania11234 (過敏好痛苦)   2023-05-05 12:31:00
嗯,看不懂。有沒有大神認真解釋一下這篇的名詞跟重點QQ
作者: Presentation (代表)   2023-05-05 13:12:00
統計數據圖表不是已經說明原po 解釋的問題點了,哪裡看不懂?

Links booklink

Contact Us: admin [ a t ] ucptt.com