研究方法-資料探勘問題

作者: jimkukky (kukky)   2016-02-01 16:08:11
假設我有1000筆資料,品項為10種
我是以人工方式根據品項的次數高低去分組,
分為A、B、C、D四個資料組,
suppport為0.1,
把四組分別下去跑關聯規則,
類似多重支持度的概念。
而目前問題是想利用自動化方式去跑關聯規則,
重點是不需要以人去根據次數高低去分組,
不知道有何方法?可以自動化跑多重支持度的方式或者是以次數頻率分析的方法之類的?
麻煩大大謝謝!
作者: hsnuyi (羊咩咩~)   2016-02-02 01:03:00
看不太懂你想做啥 是要把1000筆資料自動分成四組?然後這四組分別要有高度相關性是嗎?
作者: mosenay   2016-02-03 23:29:00
單純分組的話可以參考一下cluster analysis不過不清楚你說的每組具有相關是指組內還是組間
作者: hsnuyi (羊咩咩~)   2016-02-05 01:07:00
clustering有很多種方法啊 你try過哪些了呢?google clustering algorithm, wiki裡就一大堆python也有ML的package可以用 應該幾行code就可實作了

Links booklink

Contact Us: admin [ a t ] ucptt.com