作者rayray0410 (D-O-DoubleG)
看板Python
标题[问题] ptt 爬出作者跟文章怎麽存进excel里?
时间Tue Mar 5 17:21:01 2019
练习爬虫的路上先从ptt 下手
最近遇到的困境是该怎麽把爬到的内容存进excel里
原本是想说利用list 一个存标题、一个存内文,再用dataframe输出至excel
但一直存不进去,看着错误代码才想到 爬到的不是string
而是 item 或是 object的东西
以下是简略的程式码,标题存进title的list、内文存进article里
ptt_title = soup.select('span.article-meta-value')
// 标题
title[count] = ptt_title[2].text
content = soup.find(id="main-content").text
// 内文
article[count] = content
count++
但显然.text 是没办法直接存入的! 所以想请教版上的各位
还有甚麽办法可以存进excel呢??
感谢各位!!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 163.14.44.35
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1551777663.A.3A4.html
1F:→ jiyu520: pandas 03/05 22:21
3F:→ rayray0410: 谢谢!关键好像是.text()? 03/05 23:00
4F:推 powerkshs: df.to_excel 03/06 00:47
5F:推 lemon651: 估计是没转成text吧 03/06 11:47