[問題] kmeans 大數據 版本

作者: f496328mm (為什麼會流淚)   2016-08-15 15:57:04
跑kmeans出現以下訊息
Warning message:
Quick-TRANSfer stage steps exceeded maximum (= 1318974700)
看起來是 已達最大值
我的data 有2.6千萬筆
想問問看有沒有
大數據的kmeans版本
或是解決方法 或是說這是warning所以不用理他???
謝謝
作者: qhair (卡早睡卡有眠)   2016-08-15 20:34:00
如果會用Spark的話可以用SparkR的kmeans
作者: celestialgod (天)   2016-08-15 22:36:00
你沒有多台機器跑spark效益就不大了
作者: Wush978 (拒看低質媒體)   2016-08-15 23:56:00
Sampling?
作者: cywhale (cywhale)   2016-08-16 14:31:00
我知道biganalytics有bigkmeans這個function不過我沒用過
作者: clickhere (It's time to go home.)   2016-08-16 22:22:00
pmclust::pkmeans 要多大有多大, 只要機器夠多就行.

Links booklink

Contact Us: admin [ a t ] ucptt.com