各位大大,大家好,小弟最近在学爬取影片
但遇到了一个问题,有些影片网站,进入网址後,完全找不到真实影片的地址
需要去启动影片或加载拨放器,影片才会嵌入,才可以看到。
这边就遇到了一个瓶颈,就是爬取到了影片网址,但却找不到真实影片地址,造成无法
爬取,小弟要下载的影片类型是openload,但有些网址为了要转取更多的广告收益,
会在openload外面多加东西,你需要跳过或者启动影片才会加载最後的影片位置,
不然直接进网址後f12是找不到的。
以上就是小弟遇到的问题,希望有大大可以提供思路或者相关教学。
小弟是自学,还有很多不懂的地方,请多多包涵。
刚刚不小心编辑了整个文章,有一位大大的推文就被删除了,真的很抱歉
在这边回答大大,小弟要爬取的影片格式不是DASH的,很感谢大大的回文。
※ 编辑: swwy1661 (39.8.166.55), 05/06/2019 13:48:43
※ 编辑: swwy1661 (60.250.176.130), 05/06/2019 14:28:14
1F:推 zeus85072: 要不要去接人家写好的ex:youtube-dl 05/06 14:54
2F:推 rexyeah: 那些外加的东西不是问题,因为最後他还是得发一个只有 05/06 19:47
3F:→ rexyeah: openload认得的request,你要做的是分析那个网页去跟 05/06 19:48
4F:→ rexyeah: openload要source的时候是request什麽url 05/06 19:48
5F:→ rexyeah: 以某站来说,不管他加了多少广告,最後他就是跟openload 05/06 19:49
7F:→ rexyeah: 只要知道HASH怎麽生成就可以直接用curl把影片透过http 05/06 19:50
8F:→ rexyeah: 下载,不需要去模拟点广告的行为。 05/06 19:51
9F:推 nini200: selenium 05/11 06:31
10F:→ nini200: 一定有网址的 只是要找出麻烦 05/11 06:31