作者NonsenseKing (经验使人成长)
看板PHP
标题[请益] 抓网页中的图片网址
时间Thu Nov 13 11:46:51 2014
<?
$text=file_get_contents('
https://store.line.me/themeshop/showcase/zh-Hant');
eregi('<ul class="mdMN02Ul">(.*)<!--/MdMN02ItemList-->',$text,$match);
preg_match_all('/<.img.*?src=\s*?[\'"](.+)[\'"].*?>/i',$match[0],$match2);
echo $match2[0];
?>
我先处理了一次原始码分析,在要把原始码中所有图片中的网址都印出
<img src="
http://123.jpg">
<img src="
http://456.jpg">
我只要
http://123.jpg
http://456.jpg
後面的我能用 substr 去取理,但是前面的 $match2 出不来...
是哪边出了错呢?
麻烦前辈指导~
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 27.246.133.164
※ 文章网址: http://webptt.com/cn.aspx?n=bbs/PHP/M.1415850418.A.5DA.html
1F:→ JustGame: preg_match_all("|img src=\"(.*)\"|U", $match[1], $ma 11/13 12:12
2F:→ JustGame: tch2); 11/13 12:12
3F:推 rockmanalpha: 我会用 PHP Simple HTML DOM Parser 11/13 15:16
4F:→ rockmanalpha: 直接将页面Parse到一个Object 後面的处理就跟你用 11/13 15:17
5F:→ rockmanalpha: JQuery的Selector差不多 11/13 15:17
6F:→ NonsenseKing: to J : 我 echo 出 $match2[0] 一样只会出现 array 11/14 06:44
7F:→ NonsenseKing: 这个意思应该是阵列没内容或抓到? 11/14 06:45
8F:→ NonsenseKing: to r : 谢谢教导,但本人是学不到三天的初学 11/14 06:46
9F:→ NonsenseKing: 我会再去研究这个方法的,我用的空间是 heliohost 11/14 06:47
10F:→ NonsenseKing: 希望有支援这指令,因为我连 session_start 都不能 11/14 06:47
11F:推 rockmanalpha: 你可以先用print_r($match2)看看整个Array的内容 11/14 10:42
12F:→ rockmanalpha: 因为你用preg_match_all得到的结果应该是每个匹配 11/14 10:44
13F:→ rockmanalpha: 的结果是一个Array然後放在match2这个Array里面 11/14 10:44
14F:→ rockmanalpha: 所以你$match2[0]只是指向第一个结果 并没有指向第 11/14 10:45
15F:→ rockmanalpha: 一个姞果的内容 以以上的正则 应该你想要的结果会放 11/14 10:46
16F:→ rockmanalpha: 在$match2[X][1]之中 X取决於匹配的结果 由0开始 11/14 10:47
17F:推 rockmanalpha: ^数量 11/14 11:41
18F:推 pizzafan: 哪里有preg相关语法教学?...php我一直没学会的就是这部 11/14 12:18
19F:→ pizzafan: ...\"(.*)\"|U"...这个对我来说是外星人语言 11/14 12:19
20F:→ KawasumiMai: google 正规表示式,这个跟php无关,很多语言共通 11/14 13:50
21F:→ KawasumiMai: 也有专版可以讨论 11/14 13:51
22F:→ MOONRAKER: 基本部份很直觉的,先不要学look-ahead就好 :D 11/14 19:26
25F:推 rockmanalpha: 还有上面我提到的这个是library 你只需要在他的网 11/14 20:32
26F:→ rockmanalpha: 站下载然後上传到同目录require就好 不过确实在学 11/14 20:33
27F:→ rockmanalpha: 习阶段就一步一步来吧 但这方法以後可以用到 11/14 20:33
28F:→ rockmanalpha: SIMPLE HTML DOM我真的觉得还蛮好用的 尤其有写过 11/14 20:34
29F:→ rockmanalpha: 前端程式(JQuery)的话 非常好上手 11/14 20:34