[問題] 請問關於時間相關的data做散布圖的方式

作者: koow ( )   2020-12-14 01:36:23
各位前輩好~
小弟幾天卡在一個做圖的想法 想請教各位前輩
我有一組資料 是每天不定時(有可能9:30 也有可能10:15之類的)
開始後每一分鐘對應一個Y值
所以假設時間長度一年 那就是有365組data
每組data有Y1(開始後第一分鐘的值),Y2(開始後第二分鐘的值).....etc
小弟最終想做的是
開始後的第X分鐘 VS 對應的Y值 所有的資料的散布圖
目前我想到的作法是 先令dataframe每一列為 [開始後第X分鐘,對應Y值]
然後散布圖第一個X值就抓 dataframe[X=1]出來 以此類推
這樣做的缺點感覺是 dataframe 的index會非常多
不知道版上的各位前輩還有沒有更好建議的做法呢?
感謝各位~~
作者: Starcraft2 (來自星海的你)   2020-12-14 07:06:00
index多也是還好, 就365*24*60 ~= 52萬5千筆主要是你想要畫出來分析什麼?每週/每月/每季的趨勢?需要細到分鐘還是group by到每天或每小時就可以了還是有什麼其他作圖的目的
作者: LP9527 (ㄊㄇ抽菸都去)   2020-12-14 08:12:00
先把每天時間減一減不就好了嗎喔不是 你這個資料應該要畫曲線圖
作者: koow ( )   2020-12-14 08:59:00
舉例 我想觀察以最後結果(陰天 or 晴天)來說 假設Y是濕度那我是不是陰天的話 每天起始點後每分鐘的溼度 幾乎都大於晴天 我想觀察的是這種趨勢 並且來做ML分類 或是 回歸的一些應用 但我想先全部畫在圖上看趨勢 XD 所以才有這個問題
作者: LP9527 (ㄊㄇ抽菸都去)   2020-12-14 14:59:00
要看每個時間點與多index看起來你的問題很矛盾,要嘛你找別種圖呈現, 要嘛就統計數一數
作者: lycantrope (阿寬)   2020-12-16 17:05:00
用column去分類時間,再groupby去分群作圖

Links booklink

Contact Us: admin [ a t ] ucptt.com