[問題] 請問SVM的問題

作者: KatherineM (憶 本象)   2013-01-31 11:27:56
大家好,我有一個關於 SVM 的小問題想請教。
就是 SVM 中 feature 的值能不能混用 binary,例如: <0,1>來表示有出現跟沒出現
跟連續值,例如: <0.7, 0.9> 這種經過權重後的數值。
因為我是做 text mining,我想要同時有 binary 跟 權重的特徵,
但不曉得這樣混用會不會有影響,或是有要考量的地方,請大大們指教。
p.s. 因為我第一次找到這個版,若是有其他更適合討論 Machine Learning 相關的
地方,煩請告訴我,謝謝!!
作者: bob123   2013-02-01 04:39:00
fuzzy SVM ?
作者: KatherineM (憶 本象)   2013-02-01 10:33:00
所以代表SVM原本是不建議這樣設定特徵值囉? ~"~
作者: cansas (cansas)   2013-02-04 19:47:00
我研所作文件自動分類 有使用Weighting的效果會比Binary的表示方式好得多 就是會分的比較準 如果你要混用 我覺得可以試試啦 不會怎樣 效果不一定 有時候也要看那個Feature是否本身有鑑別力
作者: h3615840 (屁屁豬)   2013-02-15 19:05:00
剛好我目前也在做類似的研究!目前感覺起來還是feature的鑑別度影響比較大,目前我也有用到混用的部分,在可以拆成多個binary的情況下,使用binary的效果感覺上比起用單一個實數表示稍微好些,不知道是不是因為採用更多維度做判斷有利提升準確性的關係

Links booklink

Contact Us: admin [ a t ] ucptt.com