[分享] FeatureHashing

作者: Wush978 (拒看低質媒體)   2015-01-21 23:40:58
[關鍵字]: FeatureHashing, hashing trick, R
[出處]:
https://www.youtube.com/watch?v=CdMzHLrmpi8
這是我在社群介紹CRAN的套件:FeatureHashing時的錄影
在以預測為主的分析,處理大量資料時,
如果有大量Categorical Variables,
用這個套件可以讓寫code簡單很多(但是準確度會掉一點點)
也可以當作一種randomized dimension reduction使用。
歡迎有興趣的版友試用,有問題也歡迎找我交流。
作者: braveht (衝吧衝吧)   2015-01-21 23:46:00
為什麼有dimension reduction效果?
作者: Wush978 (拒看低質媒體)   2015-01-22 00:09:00
你可以設定hash過後空間的大小有Paper計算這種方式降維後,向量內積的誤差範圍
作者: gsuper (Logit(odds))   2015-01-22 23:33:00
正需要這種 我現在都不處理 numeric 了, 直接都轉artifically category variable
作者: kenshin528 (成立奧凶帝國!!)   2015-01-23 23:32:00
推推感謝分享

Links booklink

Contact Us: admin [ a t ] ucptt.com