作者harryron9 (两个世界)
看板Python
标题[问题] pandas处理多个csv找指定的csv
时间Fri Dec 20 13:24:32 2019
假设我现在有例如 AAA001.CSV
AAA002.CSV
.
.
.
AAA020.CSV
每个档案的格式都一样 假设有一列叫成功率
我想要寻找成功率最高的CSV 把那个CSV复制到其他资料夹
目前想法是回圈读20个档案 读出最大值与MAX比 记录档名
回圈完後pandas读取 写入到其他资料夹
感觉绕有点多圈 不知道有没有比较好的方法
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 101.9.204.56 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1576819474.A.2C8.html
1F:→ Hsins: 没有,都是不可省略的步骤。你如果觉得要读两次档案,可以 12/20 13:33
2F:→ Hsins: 一次读入再去筛,不过并不会比较好…吃记忆体而求不会快到 12/20 13:33
3F:→ Hsins: 哪里去… 12/20 13:33
那如果我每个CSV都是500行
好像可以concat ignore index
之後直接找df.idxmax 用index来决定档名
不过concat也是要一个一个做 没比较快的样子
※ 编辑: harryron9 (101.9.204.56 台湾), 12/20/2019 13:46:24
4F:→ Hsins: 复杂度一定至少 O(n),那个遍历一次的过程是去不掉的。 12/20 13:49
5F:→ Hsins: 你能做精简的就是比如回圈时,能不能花更少时间更少空间 12/20 13:50