作者Linux (Windows)
看板PHP
标题[请益] 用 curl 抓 ppt.cc 的图片
时间Sun Jan 19 20:20:58 2014
最近需要做一个 爬 open graph 的功能
其中遇到 og:image 的网址是使用 ppt.cc 的图片
我使用 curl 试着去抓取网址的图片,结果都抓到该 ppt.cc 的网页内容
但是如果将网址 放到 <img /> 标签内,浏览器却有可以 看的到图片。
举个例子好了...
假设 我要抓取
http://ppt.cc/[email protected] 这张图片
如果我写一个静态 html 内容使用 <img src="
http://ppt.cc/[email protected]" />
用浏览器看到的是一张图片
但是使用 curl 抓回来的却是网页档案,档案内容就像直接用浏览器开这个网址一样
我大约知道 curl 就是模拟浏览器发出要求并取回内容
但是用 <img/> 的方法应该也是浏览器对该网站发出要求吧?
差别是? 还是说我 curl 应该怎麽设定参数才会对 >"<
希望板上大大们给我个提示方向或关键字的 >///<
--
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 61.230.183.54
1F:推 LaPass:试试看加上reffer我猜他们是看这个去判断的 01/19 21:29
2F:→ Linux:感谢!!!!!! 真的可以耶!!! 感谢!!!! 01/19 22:13
3F:→ Linux:curl_setopt( $ch , CURLOPT_REFERER , $referer_url ); 01/19 22:13
4F:→ Linux:加上这个就OK了! 01/19 22:13
5F:推 LaPass:恭喜 XD 01/20 08:22
6F:→ hans5300609:ID好妙www 01/23 02:06