作者wil771126 (雨的印记)
看板Python
标题[问题] 这是编码的问题吗??
时间Wed Oct 14 02:37:10 2009
再度上版请教
我有一些htm档 我要写他的parser
之前已经写过一批 大致完成
最近这一批 就很奇怪
我在htm档右键点编辑 htm档看起来很乱 虽然还不至於完全乱码
就是出现不少黑色长方型字元那样
用NotePad++开 就很正常
重要的是 当我要写parser的时候
我先将原始档分成一行一行 (list)
再找有哪个项目出现特定文字
for i in li:
if "地区" in i:
......
结果是通通找不到
这个"地区"关键字就算用编辑打开(有点乱那个) 也还看的到
後来我全文搜 当然也搜不到 "地区" 这个关键字
这到底是甚麽问题呢@@
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 163.22.18.78
1F:推 superGA:请检查编码 html 跟你的 code 10/14 02:50
2F:推 buganini:CRLF和CR 10/14 16:48
3F:→ buganini:Notepad++转成Windows格式应该就可以了 10/14 16:49
4F:→ wil771126:问题在utf-8 找到了 谢谢大家^^ 10/14 17:23
5F:→ wil771126:随後加进资料库 又乱码了 该怎麽办ˊˋ 10/16 02:20