作者billdarkest ()
看板Python
标题[问题] 抓取txt特定内容并作注解or计算
时间Thu Feb 6 22:36:36 2020
各位前辈大家好
小弟闲暇时间会上网自学python来优化工作流程
最近遇到一个txt文本处理的问题如下:
https://imgur.com/RDgjPdd
每次收到的档案中我所要解析的行数并不固定,可能第8行到第15行,可能是10~30。
是否请大佬指点一下要从哪个方向下手才能在txt的相对位置上填上均重?
我目前的进度只到能把文本内容全部list出来而已,可以说是进度0。
for i in range(0, lines.__len__(), 1):
list = []
for word in lines[i].split():
word = word.strip( )
list.append(word);
word = word.strip()
list.append(word);
print(list)
希望各位前辈给个关键字或方向指导一下,身边没有资讯人可以问,而我只会一点点爬虫的基础而已。
所以如果有用词不精准或叙述不清楚的地方望各位前辈海涵
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 60.250.224.22 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1580999798.A.AE5.html
1F:推 TitanEric: 读到标头之後 读你要的资料 然後舍弃乱码 02/06 23:07
2F:推 lemon651: 1.range(len(lines))可以达到一样效果2.不用加; 02/07 12:45
3F:推 poototo: 正则表示式? 02/07 12:49
4F:→ alvinlin: 首先先问你的文字档哪来的为什麽有乱码?然後加上均重後 02/07 14:59
5F:→ alvinlin: 处理好的档案要做什麽? 02/07 14:59
6F:→ alvinlin: 这几个模组csv,re应该有帮助 02/07 15:01
7F:→ billdarkest: 大大 其实我只是把我不需要的资料当成乱码而已 主要 02/07 15:27
8F:→ billdarkest: 是想知道如何找特定的资料做注解再放回指定的位置 02/07 15:27
9F:→ alvinlin: 不能从源头去加吗? 02/07 16:17
10F:→ alvinlin: 如果不需要的资料的部分也是格式化的,用csv读进来再csv 02/07 16:18
11F:→ alvinlin: 写回去即可 02/07 16:18
12F:→ alvinlin: 或是用seek()定位到要加的位置 02/07 17:42