作者ELivan (ELivan)
看板Programming
标题[问题] Heroku 後台爬虫 无法写入资料库
时间Tue May 29 16:31:37 2018
想请问有没有办法将定时爬资料也部署到Heroku上
或有没有其他能达到同样目的的方式?
-------------------------------------------
更新一下问题
最近学习架设 Django 网站
写了一只爬虫程式来获取资料并存入Django的资料库
原本是把爬虫写在 views.py 中
在网页里面放一个"获取资料的按钮" 就会执行爬虫
这边上传到heroku後都能正常执行
现在我想把爬虫改成在後台运行
尝试许多方法都失败,由於我不知道问题点在哪,下面是最後一次尝试的方法
专案名称为 game 里面有 gameapp 这个应用程式
我使用 abscheduler 让爬虫程式定期执行,并将档名命名为 <crawler.py>
由於我把 <crawler.py>放在 gameapp 目录时,在本机端测试网页都会一直要执行定期爬
虫而跑不出网站
所以我把 <crawler.py>放在专案根目录 ,并加入以下程式码才能正常调用 Django ORM
import django
import sys, os
os.environ.setdefault("DJANGO_SETTINGS_MODULE", "game.settings")
from django.conf import settings
django.setup()
然後在 Procfile 加入下面这行:
clock: python crawler.py
用git更新好网站後
使用heroku logs 检查
可以看到有确实运行爬虫程式
连接资料库後成功储存
会显示("成功储存一笔资料")
在heroku logs 也有看到此讯息
但是资料库却没有真的更新
登入admin看资料库也没有任何变化
实在搞不懂为何会这样子,请教各位大神
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 27.247.6.85
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Programming/M.1527582700.A.C84.html
1F:→ MOONRAKER: 搜寻一下cronjob on heroku218.161.46.90 05/30 03:02
2F:→ MOONRAKER: elements.heroku.com/addons/scheduler218.161.46.90 05/30 03:03
※ 编辑: ELivan (27.247.6.85), 05/30/2018 03:21:21
※ 编辑: ELivan (27.247.6.85), 05/30/2018 03:22:12