作者senhuo (努力吧)
看板perl
标题[问题] 请问抓网页并去除html tag後 出现乱码?
时间Thu Oct 25 01:05:35 2007
请问各位高手们
我将某一网页抓下来
并用regular去除 html tag
但显示的结果竟然变成乱码,但有些网页没出现乱码,有些则有...@@
(还是去除tag前要加什麽?)
请问有人知道解决方案吗
感谢~~
程式码----------------------------------------------------------
use WWW::Mechanize;
my $mech = WWW::Mechanize->new();
my $http="
http://blog.roodo.com/judie35/archives/270979.html";
$mech->get($http);
my $html=$mech->content();
foreach ($html){
s/<[^>]*>//g;}
print $html;
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 163.25.10.78
※ 编辑: senhuo 来自: 163.25.10.78 (10/25 01:08)
※ 编辑: senhuo 来自: 163.25.10.78 (10/25 01:09)