[問卦] 嚴重資料不平衡的小資料,推薦用什麼模型

作者: WeiU (微,U文)   2020-11-24 13:45:40
欸欸肥宅
小妹我女友問我的
叫我上來問資工肥宅你們啦
她有一份資料
只有大概400組data可以用
每個data大概有20000個特徵
然後是二分法
但1的大概只有30個
剩下0的有大概300多個
非常不平衡呢
小妹我女友用了隨機森林KNN SVM
效果都很差啦
Precision 跟 recall還有F1都超低
怎辦啊
再不解決小妹我女友就要哭哭了
有卦嗎
作者: greensaru   2019-11-24 13:45:00
作者: deepdish (Keep The Faith)   2020-11-24 13:46:00
先醒醒 你沒有女友
作者: TaiwanFight   2020-11-24 13:46:00
啥模型都沒用 484套套黨連這都問阿
作者: peter210731 (ptt)   2020-11-24 13:46:00
建議 用鋼彈模型
作者: TaiwanFight   2020-11-24 13:47:00
套出來一樣是垃圾
作者: Nigger5566 (尼哥56)   2020-11-24 13:47:00
knn
作者: dangercat5 (耶樓蹦嚕)   2020-11-24 13:47:00
作業自己做
作者: hogarth1985 (扣一八一)   2020-11-24 13:48:00
鋼彈模型
作者: ZhouGongJin (ZhouYu)   2020-11-24 13:49:00
借學長訓練好的阿法狗分類
作者: nekoares   2020-11-24 13:49:00
問功課不可取,假裝有女友則可恥
作者: eterbless (守護之翼)   2020-11-24 13:50:00
資料探勘作業自己做啦
作者: praiseZun (praiseZun)   2020-11-24 13:50:00
聽起來就是什麼屁都不懂以為套套模型就算會機器學習
作者: minggood   2020-11-24 13:50:00
把資料分組訓練啦幹
作者: praiseZun (praiseZun)   2020-11-24 13:51:00
認真回random forest先套下去看feature importance
作者: robrob99 (梁龍)   2020-11-24 13:51:00
knn一定能分開啦 除非真的一坨全部同樣的

Links booklink

Contact Us: admin [ a t ] ucptt.com