把一支球隊送到季後賽去通常是各家GM們努力的目標
(需要觀念的球隊就另當別論了)
從2002到2013十一年間,總共有90隊次進到季後賽
(8*10+10*1,以往一年八支去年改成一年十支)
三十隊裡面有二十七隊有進過季後賽,最多的是NYY九次
http://ppt.cc/l3Qb
有三隊在這些年根本不知道季後賽是長什麼樣子
通通都是美聯的球隊(美東、美中、美西各一隊)
季後賽常客裡面也不乏payroll排行榜倒數的球隊
反過來說這三支球隊也都不是最最最沒錢的球隊
從這個角度來看
有不有錢跟進不得了季後賽好像關係並沒有太直接
所以我想要看看這幾年這些有進季後賽的球隊和沒進的球隊
在團隊數據上有哪些資料是有顯著的差異
或許可以提供一個補強時的考量
甚至是重新評估球員的價值
其實這個想法是在看完錢球之後想到的
電影裡面Billy Beane再挑新秀或是簽FA的時候很在意 OBP
不知道除了OBP外還有沒有其他的數據可以放進來一起評估
我把fangraphs上 投球、打擊、守備 的各項數值(大部分都不太知道哪是什麼XD)
扣除掉投手勝投勝率等勝負直接相關數據
總共51項數據
用non supervised的統計方法Principal Component Analysis主成分分析
來觀察兩組(post-season vs off-season)的趨勢
http://ppt.cc/fSOn
從2002-2013年間,有90支球隊(紅色)進到季後賽
有另外240支球隊直接放假(綠色)
從PCA圖上可以看出有分群的趨勢
代表兩組間應該有一些variable可以影響是否能進季後賽
接著再用supervised approach (PLS)試著找出最重要的variables
http://ppt.cc/rpjc
再分群效果不錯的情形下,找出Variable Importance in Projection (VIP)
前五名分別為
1. bat_wRC+:Weighted Runs Created Plus
2. pit_ERA-
3. bat_wRAA:Weighted Runs Above Average
4. pit_WHIP
5. pit_FIP-
好像都還是能夠理解
咦! 等等 那守備相關的數據不是也放了嗎??
總共18項與守備有關的數據有17項列在倒數20名VIP中
包含外野手助殺能力、內野手雙殺能力、捕手阻殺能力、UZR等等
都和能不能進季後賽關係不大
(防守野球、金守備計畫表示:________)
另外,再透過receiver operating characteristic curve (ROC)
來檢驗各項數據作為分群鑑別能力的靈敏度和選擇性
ROC 曲線下面積 (Area under curve, AUC)
若是等於1代表該進季後賽的都能被該模型正確預測出來且無偽陽性的結果產生
不過正常來說是不太可能發生的
AUC等於0.5左右大概相當於用擲杯來決定能不能進季後賽 (丟銅板好像比較合理XD)
我們可以看一下這幾項ROC的表現
wRC+ : http://ppt.cc/kru5
ERA- : http://ppt.cc/fdhU
AUC算出來最高的前兩名跟PLS中VIP最高的兩名都是同樣的
AUC=0.8 在臨床文章上已經是很不錯了
樓上討論的FIP http://ppt.cc/ypQb
表現也是相當不錯
豆爺念茲在茲的 OBP呢?
http://ppt.cc/Thux
雖然沒有wRC+ 那麼搶眼,但是比起看傳統AVG來說還是好了一些
http://ppt.cc/DECs
常常打很多安打卻得不了多少分的球隊,是不是就是少了製造得分能力的因素呢?
這要透過補強能適時擊出打點能力的選手?
或是換成調度能力和解讀球員特質能力強大的教練團?
才能提升所謂的wRC,好像也很難去驗證
至於防守端的數據我貼幾項出來
rARM, 外野手助殺能力 : http://ppt.cc/M1jP
rSB, stolen base saved, 阻殺能力 : http://ppt.cc/pvi3
UZR/150: http://ppt.cc/nEPd (好像有一點點關係了)
綜合來說,防守數值似乎和能否進入季後賽沒有太大的關聯性
也有可能是,大家都已經不錯了,
80和85分的差異不會像中職可能57跟62分那五分決定勝負
(防守野球、金守備計畫再表示:________)
因此,補一些防守專家在大聯盟中真的對球隊有幫助嗎??
我這邊指得是那些進不了季後賽還再補強的球隊
有趣的是
打者被K% 其實AUC也只有0.56,
忘記誰曾經說過三振也只不過是一種出局的方式
然而,對投手來說 投手K%的AUC 卻提升到 0.65
似乎有考量投手自己解決問題的能力
最後再把投打兩項最高分的(wRC+,ERA-)放在一起評估ROC
可以得到驚人超過0.9的AUC
http://ppt.cc/OQeO
總結來說,這些data告訴我們,
打者能創造越多得分,投手掉越少分,離季後賽就不遠了.....
怎麼突然覺得自己好像在說屁話XDDD
謝謝大家