PTT
Submit
Submit
選擇語言
正體中文
简体中文
PTT
Python
[問題] Sequential Pattern Mining 問題
作者:
icqmsn
2024-01-09 12:45:44
如下面簡易數字
客戶1於 2021_2 重複購買 產品A 3次
並於 2022_2 購買 產品B 1次
請問這樣在 Python 裡面做資料整理時
是要做成哪一種?
1. <{A},{A},{A},{B}>
2. <{A},{B}>
MemberID 產品 Year_Month
1 A 2021_2
1 A 2021_2
1 A 2021_2
2 C 2022_10
3 B 2022_1
4 C 2023_1
1 B 2022_2
2 C 2023_1
謝謝各位
作者:
Hsins
(翔)
2024-01-09 13:15:00
你的資料服務的對象是你後續的處理機制,要整理成什麼形式是看你後續要做什麼,不是看使用的是哪一種語言。比如 (2) 的格式看不出客戶 1 購買了 A 幾次,如果用途是要看哪些商品有被購買,而不重視購買次數,那就 (2) 就足夠了,而 (1) 的格式既保留了購買次數也保留了商品,甚至先後。有時候先後次序不重要,你也可以用 {'A': 3, 'B': 1} 呀
作者:
lycantrope
(阿寬)
2024-01-10 09:21:00
不是都沒差,而是商業邏輯有沒有要考慮順序先後加起來不是一,有沒有重複算,分母有一樣嗎
作者:
icqmsn
2024-01-10 12:39:00
回L大:有的,順序很重要!這樣才能預估下一代產品有多少人會再購買!計算方式我是使用 CSPADE 演算法,不知道哪邊可再細調 @@
繼續閱讀
[問題] 自動點擊在遠端主機上
interactive
[問題] flask 可以引導到aspx嗎?
lidii
[教學] FB粉絲專頁爬文
sharon9193
[問題] 可以背景執行同時還可用Console嗎?
koow
[問題] windows工作排程器無法產生log
dandanwo
[問題] 中文字內容的utf-8編碼xml檔之處理
kino818
[資訊] 大型語言模型python專題實作讀書會
seiching
[問題] 想撈傳輸到印表機的文件資料
misimisu
Re: [心得] 我的GPIB程式
a9202507
[問題] windows python連到mongodb
kino818
Links
booklink
Contact Us: admin [ a t ] ucptt.com