作者blackboy (黑男孩)
看板Python
标题[问题] 关於List的问题
时间Fri Sep 16 18:56:00 2011
我手边有一个关於系统的Log档,在我将档案读进来後丢到List内。
因为Log中每一段有特定的字元可以做为区隔,再来我需要在每段中判定是否有符合
我需要的关键字来决定是否要丢到另一个List中。
我原本的写法是利用
if str in list的方式来判定此行是否存在list中。但是有时候会遇到关键字并不
是整行的情况。
後来有想过用regular search的方式去判定该行是否有符合我需要的关键字,不过这样
我需要改成用回圈把list的每一行读出来後再用regular来比对。因为我不知道怎麽判
定回圈已经读到该List的最後一行。
我原本的想法是假设回圈已经比对过List所有的字串後,没有找到我需要的关键字才
把整个List清空,不知道是否有比较好的解法来处理这个问题呢?
谢谢
补充:
我的Log类似像是底下这样:
Tag
str1
str2
str3
Tag
str4
str5
str6
Tag
每个段落间会有固定的tag字串做为分隔,但是其中的字串行数不确定,我原先的做法
是先将全部的内容读入一个List内,然後用回圈一句一句读出来,如果遇到两个Tag包
起来的时候,就把里面的内容去filter,如果其中有一段是符合我的关键字,那麽我就
把这整段放到另一个List里面。
如果是用if str in list的方式,必须是完全符合那字串才会丢到另一个List内。
可是我有些关键字可能是在该行字串的其中一部分,那我就想说改用Regular的方式来
做filter。
Code大约像是这样,这是我一开始的写法。
try:
while True:
line = fp.next()
if regex2.search(line) and len(Error0) != 0: //抓到第一个tag
for line in check: //check是我要筛选的关键字
if line in Error0:
content = content[:]+Error0[:]
Error0 = []
getContent = 0
else:
Error0 = []
getContent = 0
elif regex2.search(line) and len(Error0) == 0:
getContent = 1
elif not regex2.search(line) and getContent == 1:
Error0.append(line)
except StopIteration:
pass
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 203.69.67.252
1F:推 kdjf:你把code丢出来会比较好看懂你的问题 09/16 20:47
2F:→ legnaleurc:for line in file: if keyword in line: list += line 09/16 20:47
※ 编辑: blackboy 来自: 111.250.27.239 (09/16 21:23)
3F:→ kdjf:fp一次是吐出什麽来? 还是一个file object? 09/16 22:12
4F:→ blackboy:fp是我一开始open的log , 是一个file object . 09/16 22:21
5F:推 kdjf:我会吧loop反过来耶... 最里面的一层传回Tag中间的内容 09/17 10:05
6F:→ kdjf:用re.split(pattern,str,1),回传的如果只有一个(no pattern) 09/17 10:08
7F:→ kdjf:再str+=file.read(size),再loop 09/17 10:09