作者AAACCCEEE (茶)
看板Perl
標題[問題] 擷取網頁面
時間Fri Feb 10 22:37:27 2012
請問一下
我是perl的新手~
爬了一下版 用了WWW:Mechanize來抓取yahoo的網頁
抓yahoo!首頁可以成功~
不過用
http://tw.search.yahoo.com/search?p=網頁
抓搜尋 "網頁" 的結果卻無法抓到中文
英文可以正常顯示~~
我也試過
print encode ("big5-eten",decode('utf-8', $mech->content));
但就是無法抓到中文=="中文的部份都被去掉~
是空白的 不是亂碼...
搞了一個晚上了...有請高手指點一下
感謝
發現用Fx開yahoo search時是utf-8編碼
換成我的程式就變成ISO-8859-1
這是什麼原因呢~~=="
--
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 114.37.49.98
1F:→ dryman:print encode("big5",$m->content);或把終端機編碼改成utf8 02/11 09:48
2F:→ dryman:你的程式丟上去query的東西也要是utf8,另外user-agent可 02/11 09:49
3F:→ dryman:能也需要設定就是了 02/11 09:49