Re: [閒聊] 嘗試以機器學習排出P+前三隊 tony790927 PTT批踢踢實業坊

Re: [閒聊] 嘗試以機器學習排出P+前三隊

作者: tony790927 (chao) 2022-07-08 10:44:58

感謝大大有趣的文～
剛看了下UCLA論文後有幾個機器學習的問題想問，因文長用回文形式，若不適合本版我再刪
文

1. 關於features數目，原論文似乎自己挑18個數據，把一些數據如總籃板數、失誤（他們?
得失誤比較無法顯示好壞表現）等拿掉

而原po似乎是遠多於18再用2次降維方式後再K-Mean

不過論文看起來他們只是拿降維後的做2D visual而已（下圖）

https://i.imgur.com/XbFWIRD.jpg

拿去K-Mean的是沒降維的，畢竟只有18維。這邊或許可以自己挑出類似features，才不會太
雜亂數據影響。

以下是他們選的

https://i.imgur.com/pYlMp8f.jpg

2. 論文最後是有說到其實「每個群是類似的」

如下圖, 每個群跟隊伍排名的線性關係p-value都很大（p-value 越大信心程度很小）

https://i.imgur.com/nx3TZqw.jpg

“This suggests that there is no relationship between how good a team is and mem
bership in a particular cluster. “

就是幾乎沒關係的意思

文中提到重點是「離每個分群質心的距離」才能顯現好壞球員，例如在x群中的離x群的中心
越遠，則球員越猛

https://i.imgur.com/FZ7CUxK.jpg

可看到p-value才0.02左右（0.98的信心）

簡言之，如果直接拿每個群當成一二三隊似乎不適合，可能用與跟質心的距離排出各個球員
才比較好。

而原PO現在分群中的第一隊，可能有些人是比較靠近質心，有些人則是遠離質心，比較好的
式可以多列出他們與質心的距離，越大則是越厲害

不過上述都是建立在你是follow這論文的作法，如果你有修改的話可能就不是我上述所說的
一樣了。

話說我也可能有錯，只是小弟的一些看法，歡迎指正。

發此文的用意只在推崇科學與運動的結合，很感動台籃版越來越活絡，也感謝原PO的effort

作者: TimmyWendell (流浪提米) 2022-07-08 12:04:00

好像有些字被吃掉了？像第一點：覺得

繼續閱讀

[討論] 即使大職籃時代，卻仍沒有球打的球員PhanCalderon [影片] 李德威兒子多多開示asd123 [新聞] T1選秀球探報告　砍將林子洧有望成黑馬s66449 [閒聊] 嘗試以機器學習排出P+前三隊chih2loveu [新聞] NBA等級體測　虎科籃球隊全力拼戰新賽s66449 [閒聊] 大B哥回歸？KoBuKoLa Re: [新聞] 陳冠全好表現　曾文鼎也稱讚asdfgh0920 [情報] 2022亞洲盃3X3 中華女子和男子代表隊賽masd911206 [專欄] PLG選秀預測分析 (球探報告)syunnnnn [閒聊] PLG總冠軍預測活動獎品發放Shiang1225