[問題] 使用R進行購物籃分析

作者: zhiying (paipai)   2018-03-12 15:25:51
[問題類型]:
程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
[軟體熟悉度]:
新手(沒寫過程式,R 是我的第一次)
[問題敘述]:
我想用apriori做十三種藥物的關聯性分析
[程式範例]:
我是參考這篇
http://www.cc.ntu.edu.tw/chinese/epaper/0036/20160321_3606.html
我的資料是二元檔,共13個變項,
beer=read.xlsx("d:\\stella\\R\\beer.xls",header=T,sheetIndex=1)
beer=as.matrix(beer)
進行到這裡之後,要計算關聯性
rule=apriori(beer,parameter=list(supp=0.2,conf=0.8))
可是計算的結果,我的lhs欄位都是空白的,只有rhs有我的13個變項,
想請問是這甚麼原因?謝謝!
[環境敘述]:
R 3.4.3
作者: clansoda (小笨)   2018-03-12 19:01:00
感覺跟前幾篇文章有87%像
作者: zhiying (paipai)   2018-03-12 22:42:00
我有先搜尋"購物籃",版上的文章,但沒看到跟我一樣的問題,但也可能是我是新手看不出來lol我的檔案各個變數已經是0和1,不過我跑了轉換矩陣那行程式後,雖然檔案描述有變成矩陣,可是打開檔案呈現的樣子還是跟轉換前的一樣, 這是正確的嗎?還麻煩各位高手幫忙解惑了!
作者: Luluemiko (露露)   2018-03-13 00:22:00
關鍵字可以找關聯性分析
作者: f496328mm (為什麼會流淚)   2018-03-13 10:22:00
你範例能跑成功嗎?如果可以,看看data的差異,或者是參數的問題
作者: clansoda (小笨)   2018-03-13 10:55:00
建議你調低你的supp跟conf,你這兩個都很高,可以看一下document這兩項分別代表什麼,conf 0.8幾乎篩不出任何值是很正常的
作者: zhiying (paipai)   2018-03-13 12:24:00
謝謝大家的回覆!不好意思沒有講清楚,我的樣本數有13000,supp跟conf我都調到小數點下好幾位,但結果都還是跑不出來,這樣是代表我的資料之間沒有關聯性嗎?我跑範例beer那個就跑的出來,觀察了資料,都是0,1的二元檔,差在我的變數和資料比數多很多。
作者: clansoda (小笨)   2018-03-13 12:45:00
很難說,但我的經驗是調低以後,那種空白的現象還是會有但是如果一筆有效資料都沒有的話,可能你還是要檢視自己的資料,究竟有沒有你想要的關係
作者: f496328mm (為什麼會流淚)   2018-03-13 13:04:00
有辦法公開 DATA 嗎? 這樣會比較清楚問題
作者: zhiying (paipai)   2018-03-13 18:10:00
https://i.imgur.com/PiDsqzW.jpg後來又檢查了資料發現是我在合併資料的時候犯錯,難怪都跑不出來。謝謝大家的提醒!然後我想再請問,有辦法設定lift的下限嗎?還有這個網路圖,有辦法加入各個品項的出現頻率大小嗎?謝謝!然後我發現在加上minlen=2這個條件設定就可以避免掉lhs是空白的結果,不知道這樣對不對。
作者: Luluemiko (露露)   2018-03-13 18:36:00
lift不能設下限,只能事後從結果篩出子集合

Links booklink

Contact Us: admin [ a t ] ucptt.com