作者woominin (没事就好)
看板PHP
标题[请益] 多网页parse
时间Thu Oct 2 17:37:10 2014
不好意思,又要请教有关於parse的问题
想请问 在parse完後
我得到了
名称 + 网址
名称 + 网址
名称 + 网址
这样很多个网址
要怎麽去把这一堆网址再丢去 第二层做multi url parse呢 ??
看simple dom 的范例都是单独一个网址
// Create a DOM object from a URL
$html = file_get_html('
http://www.google.com/');
那像我上面那样 第一次parse後,一堆网址怎麽再去塞第二次再爬虫呢
总不能手动一笔一笔丢吧 XDDDDDDDDDDDDDDDD
不好意思,请前辈们解惑
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 123.51.223.4
※ 文章网址: http://webptt.com/cn.aspx?n=bbs/PHP/M.1412242633.A.2B8.html
1F:推 hit1205: 为什麽要手动呢 XD? 用 foreach 一个个丢? 10/02 21:16
2F:→ KawasumiMai: 递回 10/03 14:42
3F:→ KawasumiMai: 记得设定深度,还有重复判断,否则没完没了 10/03 14:42
4F:→ KawasumiMai: 通常这种应该是深度优先,广度优先很占记忆体 10/03 14:43