[問題] pandas resample 遺失資料

作者: nathan7812 (nathan)   2018-06-07 22:03:50
請問各位前輩
我在做resample的時候form daily to weekly
daily 的資料裡並沒有NaN
但是轉換成weekly後就多了21row的NaN
爬了很多文都找不到原因
請問大家這是什麼原因呢?
Input:
df_ohlc = df.resample('W').agg({'Open': 'first',
'High': 'max',
'Low': 'min',
'Close': 'last'})
print('count df_ohlc weekly null value:'+str(df_ohlc.isnull().sum()))
Output:
count df_ohlc weekly null value:Open 21
High 21
Low 21
Close 21
dtype: int64
Open High Low Close
Date
2014-12-21 NaN NaN NaN NaN
2015-01-04 NaN NaN NaN NaN
2015-01-18 NaN NaN NaN NaN
2015-01-25 NaN NaN NaN NaN
2015-02-22 NaN NaN NaN NaN
2015-03-01 NaN NaN NaN NaN
2015-04-26 NaN NaN NaN NaN
2015-05-03 NaN NaN NaN NaN
2015-05-10 NaN NaN NaN NaN
2015-08-02 NaN NaN NaN NaN
2015-08-09 NaN NaN NaN NaN
2015-08-23 NaN NaN NaN NaN
2015-11-29 NaN NaN NaN NaN
2015-12-20 NaN NaN NaN NaN
2016-02-14 NaN NaN NaN NaN
2016-04-10 NaN NaN NaN NaN
2016-04-24 NaN NaN NaN NaN
2016-06-12 NaN NaN NaN NaN
2016-07-17 NaN NaN NaN NaN
2016-07-24 NaN NaN NaN NaN
2016-07-31 NaN NaN NaN NaN
附上2014-11-26~2018-06-06 0050.TW.csv檔https://tinyurl.com/ybffoxlt
作者: kiloxx (名器)   2018-06-07 22:46:00
有幾周沒開盤阿!如新年連假之類的
作者: nathan7812 (nathan)   2018-06-08 12:03:00
K大提到的問題我回去檢視後,好像不僅止於放假的問題?
作者: bazoo (surfers'paradise)   2018-06-08 13:24:00
你的原始資料缺的很嚴重喔,很多天都沒資料
作者: nathan7812 (nathan)   2018-06-08 13:29:00
謝謝B大提醒,原檔真的缺的很嚴重,冏rz結論上來說明一下,yahoo finance的歷史資料真的缺很大,在找不到其他api之前,只能自己爬了。

Links booklink

Contact Us: admin [ a t ] ucptt.com