作者kornelius (c9s)
看板RegExp
標題Re: [問題] preg_match_all抓取所有<div>....</div>
時間Sat Jul 25 21:25:45 2009
請用 Perl 的 Web::Scraper 模組 :p
http://search.cpan.org/dist/Web-Scraper/lib/Web/Scraper.pm
就可以做到 tree structure 的 parsing
只需要給定 css selector 即可
當然也有 xpath 做 selector 的後端。
※ 引述《X700 (X700)》之銘言:
: ※ 引述《grassboy2 (活力花俏草兒仔政﹞O花俏)》之銘言:
: 我也有問題和這位仁兄相似,但是我想做的就是巢狀時要如何正確抓資料呢?
: 如下的例子:
: <div class="test">
: <div>我是大巢
: <div>我是小巢</div>
: </div>
: </div>
: 希望可以抓到div class="test"內的資料:
: <div>我是大巢
: <div>我是小巢</div>
: </div>
--
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 113.61.194.203
※ 編輯: kornelius 來自: 113.61.194.203 (07/25 21:26)
1F:推 othree:Perl真是什麼都有XD 07/27 16:07
2F:推 lg31cm:不過事實上perl的regex用法最為變態XDDDD 07/28 00:47
3F:推 arrack:perl包山包海 07/30 19:52
4F:→ MOONRAKER:It's PERL that rocks the world 08/11 17:59