作者jerryskin (小光)
看板Python
标题[问题] 请问如何大量下载某网页上的图片
时间Wed Jan 22 23:20:51 2020
——2/1——
感谢板友的回覆与来信
全部的照片已手动备份完毕
现阶段还是很多人
因无法一次性备份照片而苦恼
被这款流氓app绑架中...
——1/24——
处於放弃状态…一天一天备份中
感谢板友
——1/23——
浏览器使用chrome,网页完整储存档案
https://tinyurl.com/wr4sera
请板友帮忙看网页结构,谢谢
————————
因为从小孩2015年出生到现在
都使用(时光小屋)这个APP
从2018年8月开始
APP制造商不再提供照片批次备份程式
网页也没有备份照片的按钮可以按
只能透过手机APP,一天一天的去备份照片
备份下来再想办法传送到电脑
我有3个小孩,分别使用4年2年1年
我有3个小孩,分别使用4年2年1年
我有3个小孩,分别使用4年2年1年
全部7年,一共2100天,等於要备份2100次
google许多方法都无效
(可以google"时光小屋备份"就知道了)
後来发现有python
研究了一两天还是没有办法成功一次性的下载
目前自行摸索状况如下
import requests
from bs4 import BeautifulSoup
res = requests.get('
https://www.peekaboomoments.com/zh-CN/home/537104626')
soup = BeautifulSoup(res.text)
for img in soup.select('???????'):
print ???????
卡关了.....不知该如何继续下去
来此版寻求帮助,谢谢各位
--
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.175.13.86 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1579706454.A.5E1.html
1F:→ dododavid006: 如果要知道如何下载需要知道网页的结构,但你给出的01/22 23:34
2F:→ dododavid006: 如果要知道如何下载需要知道网页的结构,但你给出的01/22 23:34
3F:→ dododavid006: 网址似乎需要登入才能看到内容,所以如果你无法给出01/22 23:34
4F:→ dododavid006: 网址似乎需要登入才能看到内容,所以如果你无法给出01/22 23:34
5F:→ dododavid006: 一个范例来我觉得版上的大大们也是会爱莫能助01/22 23:35
6F:→ dododavid006: 你可以把网页存下来,存的时候选完整内容,然後会拿01/22 23:36
7F:→ dododavid006: 到一个 html 档与一个资料夹,资料夹中你可以把你的01/22 23:36
8F:→ dododavid006: 小孩的照片删掉,再把档案跟资料夹一起压缩传到云端01/22 23:37
9F:→ dododavid006: 这样网页中照片的部份就会处於遗失图片的状态,但这01/22 23:37
10F:→ dododavid006: 不会影响到检查网页结构的部份01/22 23:38
11F:→ dododavid006: 另外我个人的意见是,虽然 python 也是能做这种事,01/22 23:38
12F:→ dododavid006: 但因为还要处理登入的问题,所以可能使用浏览器的01/22 23:39
13F:→ dododavid006: userscript 会比较方便01/22 23:39
感谢d大,我再下载整个网页给板友们帮忙看网页结构
※ 编辑: jerryskin (1.175.13.86 台湾), 01/23/2020 00:28:26
14F:→ vi000246: 你要不要直接发案给别人接比较快01/23 01:49
感谢v大
没有这样子的经验,请问如果依此案的需求可能会需要多少费用呢?
没有这样子的经验,请问如果依此案的需求可能会需要多少费用呢?
如果不方便透漏也可以站内信,谢谢
15F:推 fiorentino: 可以用Python的selenium来做01/23 04:46
16F:推 fiorentino: 可以用Python的selenium来做01/23 04:46
感谢f大
我再朝selenium的方向前进看看
※ 编辑: jerryskin (1.175.13.86 台湾), 01/23/2020 07:40:17
※ 编辑: jerryskin (1.175.13.86 台湾), 01/23/2020 07:50:43
※ 编辑: jerryskin (1.175.13.86 台湾), 01/23/2020 07:50:43
※ 编辑: jerryskin (1.175.13.86 台湾), 01/23/2020 07:51:25
17F:推 shala: 从提供的网页结构仍无法确定大图网址,帮不上忙01/24 16:59
18F:推 shala: 从提供的网页结构仍无法确定大图网址,帮不上忙01/24 16:59
感谢s大
目前处於放弃状态 以天备份中
不过如果有方法的话 应该可以帮到很多人
※ 编辑: jerryskin (223.139.250.36 台湾), 01/24/2020 17:13:22
※ 编辑: jerryskin (223.139.250.36 台湾), 01/24/2020 17:15:16
19F:→ s860134: 我尝试注册 看起来没有提供网页板?01/24 22:25
回s大
我没有单纯使用网页注册,一开始用app注册
後来开网页登入,一样可以上传照片
※ 编辑: jerryskin (223.139.250.36 台湾), 01/24/2020 22:39:52
20F:推 windclara: 建议去CodeJob发案吧。用爬虫是有很大机会能做到。但01/25 10:33
21F:推 windclara: 建议去CodeJob发案吧。用爬虫是有很大机会能做到。但01/25 10:33
22F:→ windclara: 卡在需要登入,你无法随意公开自己的帐密。再来您对Py01/25 10:33
23F:→ windclara: thon也不算熟悉。所花的时间成本更巨大。但发案顶多101/25 10:33
24F:→ windclara: 个人知道,且还可以改掉密码,避免泄漏自己常用密码。01/25 10:34
25F:推 nyitalumnus: 好像有个软体叫做: offline enterprise.可以把整个02/01 23:49
26F:→ nyitalumnus: 网站都下载下来。02/01 23:49
※ 编辑: jerryskin (1.175.4.84 台湾), 02/02/2020 08:44:14
※ 编辑: jerryskin (1.175.4.84 台湾), 02/02/2020 17:29:22