Re: [外絮] 用機器學習模型預估MVP得主

作者: lulululula (shawdidi)   2021-04-30 13:18:56
※ 引述《timmyen (Ako)》之銘言:
: 今天早上在reddit看到的文章,覺得挺有趣,轉過來跟版友們分享。
: 小弟不是學資料科學的,如果內文有誤也請不吝指正
: 原文:https://perthirtysix.com/essay/2021-nba-mvp-race
: 懶人包:
: 作者(u/robmoo_re)利用了過去38年的NBA的球員資料以及MVP票選結果(包含排名及票數)
: 建造了一個預估球員得到MVP的機率以及MVP得主的模型,
: 利用這個模型,在過去38年中可以正確的計算出32年的得主。
: 在這個模型中,各項球員數據的權重(也就是這個模型認為影響MVP票選最重要的數據)
: 依序如下:
: https://imgur.com/33ouqUG
: 球隊勝率%
: 每場上場時間
: 球隊種子序
: WS/48
: 每場得分
: 出賽場次
: VORP
: 2分命中率
: 罰球次數
: 助攻數
: 每場籃板
: 整體命中率
: BPM
: Usage%
: 每場失誤數
: 真實命中率
: (以下不列,可以自己看圖)
: 模型利用以上數據算出每一個球員的candidacy score
: 這個分數越高者,即是模型認為越有可能得到MVP的人選
: 要特別說的是,某些數據本身是互相有關聯性的(譬如:兩分/三分命中率及整體命中率,
: 或是整體命中率跟一大堆進階數據),由於已經被重複計算過,因此單項的權重會降低,
: 不代表這項數據就不重要。
: ===
: 幾個有趣的結果
: 1. 誰是這38年來MVP分數最高的球員?
: 答案是08-09年的姆斯,分數高達4.49
: 2. 那最低分的MVP得主又是誰?
: 答案是04-05年的Nash,他當年的分數只有1.09
: 3. 誰的MVP被偷了?(誤)
: 剛剛提到38年中這個模型成功預測出32年的MVP得主,
: 這也代表其中有6年模型預測跟最終的結果是不一致的,
: (1) 2016-2017年的MVP,模型預測得主是Harden(2.73),最終由當年拿下平均大三元
: 的Westbrook(2.44, 第二)拿走MVP
: (2) 2010-2011年,當年分數最高的是LBJ(2.37),最終MVP被Rose(2.23)拿走。
: (3) 2004-2005年,也就是上面提到,Nash以史上最低分(1.09)拿下MVP的那年。
: 當年屈居第二的是Shaq (1.12,其實沒差很多),也難怪他老人家到現在還在記仇
: 另外,隔年(05-06)Nash連莊時MVP分數也不是第一(1.8),
: 當年分數第一的是LBJ(2.25),只能說Nash真的是這個模型的outlier
: 4. Kobe到底有沒有偷了CP3一個MVP?
: 如果用這個模型看,答案是沒有,當年(07-08)Kobe以2.62分拿下MVP,
: 屈居第二的CP3分數是2.2分
: 5. 38年來最大的一二名差距發生在1999-2000年,當年大歐以3.71分拿下MVP,
: 分數第二的是Alonzo Mourning
作者: DamianLillar (利拉德)   2021-04-30 13:28:00
別那麼激動 只是預測一下

Links booklink

Contact Us: admin [ a t ] ucptt.com