[問題] 迴歸分析-模型選擇:Mallow's Cp

作者: maja314 (馬甲)   2015-07-01 20:59:08
用Mallow's Cp做 model selection,
老師教先挑每種model subset中最接近母數個數(p)的Cp,然後挑最小的。
那為什麼不是直接挑最小的就好?
還是我對這個準則的理解有哪邊誤解了?
作者: funky1987 (Blacky)   2015-07-01 23:56:00
我記得好像是直接挑最小的餒 通常他也跟P最接近不過Mallow's Cp的題目我沒看過很多 僅供參考@@100地特那題 是直接挑最小的 因為他們3個Cp都離P很遠而98高考那題 挑出的Cp是2.7 p是2 而不是p=3之下的Cp=3統計版也有人問過 該先考慮min呢 還是接近p呢不過都沒有人回XDD 希望有高人能回答啦~~
作者: yhliu (老怪物)   2015-07-02 04:25:00
理論上最接近 p 的 Cp 是最符合假設的, 而最小 Cp 有可能是機會因素造成的 Cp 值偏低. 這就類似卡方適合度檢定或獨立性檢定的卡方值, 做檢定時通常只看卡方值是否偏高, 而偏低的卡方值在造類檢定中則被無視. 然而, 偏低的卡方值也可能指出一些問題, 例如孟德爾遺傳實驗資料就因卡方值偏低而被懷疑是造假 ---- 離題了. 不過, 若堅持 "Cp 最接近 p", 是否會導致選出偏複雜 (p偏高) 的模型? 我當初讀碩士班修迴歸分析時曾有此疑問, 不過我並未去鑽研, 不知學界有過什麼樣的討論, 是否有定論.
作者: maja314 (馬甲)   2015-07-02 08:03:00
感謝yhliu大的回答 獲益良多^^
作者: folksuite (Z)   2015-07-02 13:28:00
Cp = ( SSE_p / MSE_F ) - ( n -2p )當模型愈適當, SSE_p 會愈接近 (n-p) * MSE_F,也就是 Cp 會愈接近 ( n - p ) - ( n - 2p ) = p所以除了小外,還要接近 p ... 我猜應該是這樣吧...

Links booklink

Contact Us: admin [ a t ] ucptt.com