[問題] 如何去除重複內容

作者: drmexro (絲瓜瓜瓜)   2017-07-22 16:33:51
最近要整理一批資料,資料的形式大約如下
公司名稱 年份 月份 狀態
A公司 2015 1 狀況1
.
.
.
A公司 2016 12 狀況1
B公司 2015 1 狀況1
.
.
.
想要整理呈現的結果:
A公司2015年1月、2月...2016年1月、2月...狀況1
B公司2015年1月、2月...2016年1月、2月...狀況1
.
.
.
也就是公司、年份、月份、狀況不會重複出現
不會出現:A公司2015年1月狀況1、2015年2月狀況1...
這樣的情形
現在打算是把公司、年份、月份、狀況分別以不同的list分開,可是要做整理的時候發現
我只想的到用一堆if判斷跟用一堆暫時的list當容器,做法十分沒有效率而且錯誤一堆
因此想知道有沒有簡潔的辦法可以達到同樣的效果
謝謝各位大大指教
作者: paladin499 (芭樂丁)   2017-07-22 17:44:00
用dictionary
作者: uranusjr (←這人是超級笨蛋)   2017-07-22 22:11:00
聽起來你要的不是去除重複, 而是把資料分類才對?
作者: kenduest (小州)   2017-07-23 06:42:00
先進入sql db 後續要篩選會比較輕鬆
作者: drmexro (絲瓜瓜瓜)   2017-07-23 08:23:00
再研究看看 先謝謝大家
作者: nikolas (你花多少時間?)   2017-07-23 13:22:00
存成2個pandas.dataframe 再merge上面回復誤會題目 請忽略
作者: nicepeter (批特)   2017-07-23 19:20:00
建set或是dictionary

Links booklink

Contact Us: admin [ a t ] ucptt.com