Re: [心得] 認識正負值(Plus/Minus)- RAPTOR

作者: driftcreator (小雷)   2020-05-08 19:17:10
※ 引述《IBIZA (溫一壺月光作酒)》之銘言:
: 這篇的介紹大概有30%是錯的, 但錯的還蠻關鍵的
: : 正負值(+/-)可說是籃球數據界的殿堂名駒,現今你能拿來直接做球員比對的all in one數據,多帶有正負值血統。其血統表如下:
: : ・第一代「原始數據」:正負值(+/-)、官網RTG系列
: RTG不是+/-系列數據, RTG是基於Points Produced的進階數據
官網的RTG系列是把球員在場上時,球隊的得失分做百回合量化,跟+/-值一樣屬於結果數據,因此我把他們放在同一個類型下。
: 關於ESPM RPM
以下是沒有放上來的原文內容
正負值的核心問題是樣本不足的情況下準確度很差。RAPM具效性的樣本通說是三年起跳;也因此半季不到就能產出內容的正負值數據中,公開資料都是以高比例的BPM為基底,否則無法有效反應球員的當季表現。RPM雖為黑盒子,但普遍認為ESPN也是以相同的方式產出數據。
RPM對於box score的使用相當吃重是公認的,當然不一定是像RAPTOR這樣直接BPM系跟RAPM系兩組數據調比重混合出結果,但我個人不覺得只靠RAPM基底調參數就能讓結果敏感反應,特別在你2.0 matchup又多了更多小樣本參數的框框下。
因此在RPM真的公佈細節之前,我還是會把它跟有使用到+/-的數據放在同一類。
: 這邊的說明是錯誤的
: RAPM並沒有預設球員表現穩定,不存在定位或化學反應
: 相反的, RAPM利用大數據去分析lineup與lineup的對抗
: 這是RAPM被推崇的主要原因
: 但也是RAPM的問題, 因為很多lineup的回合數不足以消除偏差
: RAPM知道定位跟化學反應的影響, 嘗試用大數據去分析lineup的影響
: 你可以說他受限於數據做的不夠好, 但不能說他沒這樣做
基底APM是把結果lineup拉矩陣去求個別球員的獨立值,因此APM的假設前提就是樣本中球員每分鐘的表現恆定,不管是跟誰搭配。
: 這邊錯了, 網頁上85%跟21%指的是Total RAPTOR=85% BOX RAPTOR+21% On/Off RAPTOR
: 跟BPM和RAPM無關
這邊是我的用語不夠精準,主要是想表達前者基於BPM結構,後者基於RAPM結構

Links booklink

Contact Us: admin [ a t ] ucptt.com