[問題] 分層抽樣是否適用於正負樣本差距過大時?

作者: ciphero (奶油焗蛋餃...:))   2015-07-09 01:22:27
[問題類型]:
意見調查(我對R 有個很棒的想法,想問問大家的意見)
[軟體熟悉度]:
入門(寫過其他程式,只是對語法不熟悉)
[問題敘述]:
這裡我想問的問題,比較偏重在處理資料時使用的抽樣方式是否適合?
問題如下:
假設我有一份資料集,樣子如下:
項次 col_1 col_2 col_3 ...... col_50 result
作者: Edster (Edster)   2015-07-09 02:35:00
這是錯誤的抽樣方法,樣本並不能代表母體的分配我不懂什麼叫跑不出來。這幾個字有很多想像,但通常跟樣本無關,除非結果不符預期。這時你該抽樣的對象應該是變數欄,而非樣本。
作者: celestialgod (天)   2015-07-09 13:35:00
我測試了一下隨機資料 rpart確實給出錯誤不過沒有給錯誤訊息 就完全沒有切割NODEsummary給出error: 1tree這個套件也不行我找到了 加control = rpart.control(cp = -1)可以強迫分

Links booklink

Contact Us: admin [ a t ] ucptt.com