[問題] 多欄位去除重複元素方式?(求思路)

作者: nini200 (200妮妮)   2019-02-23 09:06:57
多欄位去除重複元素方式?(求思路)
目前爬取公司名稱和電話
將各個網站爬取資料整合起來時
會有以下狀況
欄位一(地區) 欄位二(公司名) 欄位三(電話)
台中市 公司名1 123456
中市 公司名1- 123456
中市西區 公司1 123456
以電話相同為基準去重 公司名任意留一個
三列處理完 希望只剩下一列
請問有什麼方式處理嗎
提個思路或套件都可以
感謝大家
作者: charlie11438 (煞氣a查理)   2019-02-23 09:16:00
https://bit.ly/2twYpqC 這個呢?轉成DataFrame去重
作者: nini200 (200妮妮)   2019-02-23 21:34:00
好 謝謝分享
作者: CodingMan (程式俠)   2019-02-24 09:32:00
if key in list: del else: add to listkey = 你的電話
作者: adrianshum (Alien)   2019-02-24 18:29:00
[c.tel:c for c in company_list].items() ?

Links booklink

Contact Us: admin [ a t ] ucptt.com