[問題] Sequential Pattern Mining 問題

作者: icqmsn   2024-01-09 12:45:44
如下面簡易數字
客戶1於 2021_2 重複購買 產品A 3次
並於 2022_2 購買 產品B 1次
請問這樣在 Python 裡面做資料整理時
是要做成哪一種?
1. <{A},{A},{A},{B}>
2. <{A},{B}>
MemberID 產品 Year_Month
1 A 2021_2
1 A 2021_2
1 A 2021_2
2 C 2022_10
3 B 2022_1
4 C 2023_1
1 B 2022_2
2 C 2023_1
謝謝各位
作者: Hsins (翔)   2024-01-09 13:15:00
你的資料服務的對象是你後續的處理機制,要整理成什麼形式是看你後續要做什麼,不是看使用的是哪一種語言。比如 (2) 的格式看不出客戶 1 購買了 A 幾次,如果用途是要看哪些商品有被購買,而不重視購買次數,那就 (2) 就足夠了,而 (1) 的格式既保留了購買次數也保留了商品,甚至先後。有時候先後次序不重要,你也可以用 {'A': 3, 'B': 1} 呀
作者: lycantrope (阿寬)   2024-01-10 09:21:00
不是都沒差,而是商業邏輯有沒有要考慮順序先後加起來不是一,有沒有重複算,分母有一樣嗎
作者: icqmsn   2024-01-10 12:39:00
回L大:有的,順序很重要!這樣才能預估下一代產品有多少人會再購買!計算方式我是使用 CSPADE 演算法,不知道哪邊可再細調 @@

Links booklink

Contact Us: admin [ a t ] ucptt.com