作者soul810707 (louis)
看板PHP
标题[请益] php撷取网页中script里面的meta name
时间Sun Dec 27 20:28:35 2015
各位好,我查了许久就是找不到答案,还请大家指教。
我想要撷取mobile 01网页原始码中的 keyword,我用get_meta_tag一直失败,但用Yah
oo的是可以的,所以程式应该没错,後来发现可能是因为 mobile01的keyword是在 scr
ipt里面,但我不知道该用何种方法, 还请各位指导我方向。谢谢
--
Sent from my Android
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 39.9.91.63
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/PHP/M.1451219318.A.585.html
1F:→ secondDim: mobile 01 首页的meta没有在script里面啊?12/27 22:12
2F:→ soul810707: 他的keyword 在script中12/28 08:44
※ 编辑: soul810707 (110.28.15.137), 12/28/2015 08:56:10
3F:→ secondDim: mobile01的meta看起来并没有在script里,与问题无关 12/28 09:32
4F:→ secondDim: 刚刚用爬虫测试一下,好像是mobile01的server会检查 12/28 09:32
5F:→ secondDim: user_agent,user_agent为空时会无法执行 12/28 09:32
6F:→ secondDim: 而get_meta_tags好像不会发送user_agent,导致mobile01 12/28 09:33
7F:→ secondDim: 没有回应 12/28 09:33
8F:→ soul810707: 可否给我个方向,我不知道该怎做才能抓到keyword 12/28 09:43
9F:→ secondDim: get_meta_tags没办法处理user_agent,可以尝试用curl 12/28 10:01
10F:→ secondDim: 将资料捞回来再处理。使用preg_match或其他方式找出met 12/28 10:01
11F:→ secondDim: a 12/28 10:03
12F:→ secondDim: 好像不能贴网址,不知道这样说明可以吗? 12/28 10:06
13F:→ soul810707: 我试试看,感谢解答 12/29 07:35