作者rs6000 (正义的胖虎)
看板Python
标题[问题] Pandas 汇入资料库,防止重覆资料输入
时间Fri Jan 11 10:17:17 2019
请问各位大大们
有关 pandas to_sql的问题
我的资料栏位格是如下
data.columns = ['stock_name', 'date',
'open','high','low','close','volume']
当我用 to_sql 是可以很方便地把资料输入到资料库中
data[allstocks].to_sql('stcks',engine,if_exists='append', index=False)
但是要如何去避免重覆资料写入资料库中呢???
卡关卡好久了...QQ
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 125.231.106.45
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1547173040.A.D79.html
1F:推 TuCH: 在资料库里做栏位的条件 01/11 13:00
2F:推 Tarlach: 在sql里面Insert or ignore into ? 01/11 15:53
3F:→ rs6000: 用 panda的 to_sql 写入资料库,预设就没有pk或 unique 01/11 16:17
4F:推 guaptpan: 把资料库的PK捞出来和要放入的资料比对PK,重复就把它从 01/11 22:57
5F:→ guaptpan: 要放入的资料中拿掉? 01/11 22:57
6F:→ rs6000: 目前也是用楼上大大的方法...先从资料库捞资料 01/12 07:31
7F:→ rs6000: 跟目前要写入资料库的dataframe比对 01/12 07:32