作者nini200 (200妮妮)
看板Python
標題[問題] 多欄位去除重複元素方式?(求思路)
時間Sat Feb 23 09:06:57 2019
多欄位去除重複元素方式?(求思路)
目前爬取公司名稱和電話
將各個網站爬取資料整合起來時
會有以下狀況
欄位一(地區) 欄位二(公司名) 欄位三(電話)
台中市 公司名1 123456
中市 公司名1- 123456
中市西區 公司1 123456
以電話相同為基準去重 公司名任意留一個
三列處理完 希望只剩下一列
請問有什麼方式處理嗎
提個思路或套件都可以
感謝大家
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.218.52.174
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Python/M.1550884019.A.C9F.html
2F:→ charlie11438: 重 02/23 09:16
3F:→ nini200: 好 謝謝分享 02/23 21:34
4F:推 CodingMan: if key in list: del else: add to list 02/24 09:32
5F:→ CodingMan: key = 你的電話 02/24 09:33
這只處理單一欄位吧?
6F:推 adrianshum: [c.tel:c for c in company_list].items() ? 02/24 18:29
看不懂 還是謝謝您
※ 編輯: nini200 (101.13.177.69), 02/25/2019 09:38:22
7F:推 adrianshum: 打錯了orz { c.tel : c for c in company_list}.value 02/26 13:10
8F:→ adrianshum: s() 才對 02/26 13:10
9F:推 adrianshum: 解釋另回文吧 02/26 13:13