pandas讀檔的問題

作者: iphone2003 (307)   2018-05-21 14:21:55
大家好
我現場有大概2000份檔案,每個都要用pandas去讀
可是有個問題是這些檔案的columns數量可能不太一樣
比方說有的檔案有8個columns,但有的卻有10個
我現在希望每個檔案的column名稱都以那10個columns的為主
而如果當下讀的檔案是屬於8個columns的那種,那多出來的那兩個columns裡面的資料就
都用NaN呈現即可
直接設df.columns = [我希望的那10個columns]
這樣顯然不行
有想到讀檔時就用names參數設定,不過手邊沒有電腦還沒試過這樣可不可以
請問這樣的話要怎麼做呢?
謝謝!
作者: eri820503 (snoopyahoo)   2018-05-21 14:53:00
pd.concat([df1,df2]) df1是舊的 df2是要加入的
作者: iphone2003 (307)   2018-05-22 20:19:00
研究了一下似乎真的只能先建好df後再併了...謝謝!
作者: clsmbstu   2018-05-24 18:54:00
這2000份檔案是想存成2000個df還是一個大df啊?感覺做法會不同 @@

Links booklink

Contact Us: admin [ a t ] ucptt.com