[問題] csv選取資料後如何存檔?

作者: DKnex (DK)   2022-07-21 14:31:44
大家好,小弟完全新手
目前手邊有筆CSV資料原本是[48023 rows x 10 columns]
我目標是:
1.將CSV裡面10個column篩選其中3個即可
2.從這3個columns當中的“Rank”篩選只出現1的值
3.篩選完變[553 rows x 3 columns]
然後再從url_hash當中,篩選重複出現至少5次或以上的值
4.最後保留這些值輸出成新的CSV檔案
code如下:
https://imgur.com/a/QdjZrET
我現在只進行到目標2,但我發現輸出新的CSV只有把檔案從10個columns變成3個
並沒有只保留Rank只出現1的值 (還是[48023 rows x 3 columns])
我猜測是沒把數據寫成dataframe所以存不了我篩選的資料
但實在看不懂dataframe要如何操作我的目標2和3
希望能得到各位的指點,先謝謝大家。
作者: noshortcut4u (幽門羣)   2022-07-21 15:05:00
你在df篩選的rank的那邊要重新assign給df
作者: lycantrope (阿寬)   2022-07-21 15:09:00
df[df["rank"]==1]只是篩選,並沒有改變原始dfassign, df = df[df["rank"]==1]

Links booklink

Contact Us: admin [ a t ] ucptt.com