作者travellu (旅行)
看板Perl
标题[问题] 抓取网页问题
时间Sun Apr 6 16:17:56 2008
欲抓取网页
http://www.dmoz.org/
抓网页的副函式程式码如下:
sub grasp_searchresult() {
my ( $query ) = @_;
my $browser = new LWP::UserAgent;
$browser->agent( 'Mozilla/4.76 [en] (WinXp; U)' );
my $request = q();
$request = new HTTP::Request( "Get",
"
http://www.dmoz.org/" );
my $html = $browser->request($request);
return $html->content;
}
抓出来的东西是空的
抓其它网页例如yahoo首页则是没问题
不晓得是不是这个网页有什麽特殊的限制?
谢谢!
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.116.245.222
1F:推 mosquito520:你的agent看起来很怪= =... 04/07 03:50
2F:→ travellu:一直以来都这样写,都OK!直到碰到这个网站才有问题 04/07 11:51
3F:→ travellu:不晓得一楼大大有什麽好的建议? 04/07 11:54