這個分析實在弱到我還去google了一下這作者的背景,除了這篇文章沒有其他的東西,
大概是個業餘的玩家剛剛接觸回歸分析感到我好興奮寫出來的
要做任何的統計分析一定要先回答兩個問題,這個資料是連續性還是離散性,還有,
拜託,最基本的,先把分佈看一下
第一點,球界認為身高是個決定投手成功與否的因素,但是球界是認為身高越高越好嗎?
所有的球探都會告訴你,Pedro太矮,RJ太高,那有沒有人會說Chris Sale是個比David
Price好的投手,因為他比Price高了一吋?
沒有嘛,就根本沒有人說身高是越高越好,所以這很明顯不能用連續性的資料去分析,
都已經沒有人說高一吋就好一吋了,你去證明高一吋沒有好一吋是要講給鬼聽的?
真的要做應該是把,例如說6-0以下歸一組叫過矮,6-1到6-6叫理想,6-7以上叫過高,
然後再去做這些分析嘛
第二點,我猜這個分析是做不出來的,因為95%的局數都是被中間那組吃掉,然後他取樣
的年份很可能會被Pedro跟RJ這兩個人污染很大。如果對第一點有正確的認識,然後記得
要先看一下樣本分布,就會知道這樣做根本是行不通的
他這個結果最多只能說在6-1到6-6這個理想身高的區間,高一吋並沒有好一吋,很好啊
根本本來也沒什麼人這樣想啊,值得做的是例如說6-1到6-3有沒有比6-4到6-6更差,
同樣的需要分層,大雜燴一樣去跑回歸是沒有意義的
第三點,大聯盟就是個偏差的樣本,本來過高過矮門就比較窄了,可以擠上去的是偏差
值的機會很高,這個題目要做應該用上面那種分類法去做小聯盟比較講得通
然後翻譯錯很多,還有張冠李戴把根本立場相反的話冠在引用的人的頭上的,真是相當
誤導讀者的一篇文章