作者senhuo (努力吧)
看板perl
标题[问题] 请问关於抓网页的语法
时间Tue Oct 23 22:06:46 2007
请问 我想从google搜寻引擎找出所输入的关键字後 所出现的各页面的连结
目前做到在google上 自动输入某关键字 如:「台湾」
但找出来的资料量非常多,一定也有分成好多页
所以 我就将下面分页的连结全部存起来
再打算利用程式一页一页去抓每一个相关的网页连结
但现在遇到一个问题 搜寻「台湾」後
我找了下面第二页的连结,如下
http://www.google.com.tw/search?q=%E5%8F%B0%E7%81%A3&complete=1&hl=zh-TW&inlang=zh-TW&start=10&sa=N
缩网址是
http://0rz.tw/a93cK
要利用 get "网址" 这个语法 抓取这一页上的连结时
却没办法
是不是get语法只能用在固定的网址中
如
http://www.pchome.com.tw 或
http://xxxx/index.htm
经过编译过的符号 会没办法判断出来
请问各位高手们
遇到这种问题应该如何解决呢
有没有别的语法可以支援呢
感谢~~ orz
程式码如下:
#! /usr/bin/perl
#--------------------------------------
use LWP::Simple;
use HTML::Parse;
use HTML::Element;
use URI::URL;
use DBI;
use WWW::Mechanize;
$http="
http://www.google.com/search?q=%E5%8F%B0%E7%81%A3&hl=zh-TW&lr=&start=10&sa=N";
$htm = get $http;
print $htm;
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 163.25.10.198
※ 编辑: senhuo 来自: 163.25.10.198 (10/23 22:08)
※ 编辑: senhuo 来自: 163.25.10.198 (10/23 23:40)