Python 板


LINE

[問題] beautifulsoup 上的 find() takes no keyword argument 如何解決 請問各位神人 我最近剛開始學習如何用python爬文章於是挑了mobile01當目標 但是遇到了 find() takes no keyword argument不知道如何解決,我上卓查了一些類似的文章說要改成find_all,但是卻返回”str”沒有find_all這個attribute 更何況我只要爬一個特定目標應該不會是find_all才對 以下程式碼 url="https://www.mobile01.com/newtopics.php?mode=newtopic" mWeb = openpyxl.load_workbook("mobile.xlsx") ws = mWeb.active for a in range(1,6): #建立一個requet物件,附加request Headers 的資訊,用request去打開網址 request=req.Request(url,headers={ "User-Agent":"Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/106.0.0.0 Mobile Safari/537.36" }) with req.urlopen(request) as response: data=response.read().decode("utf-8") #解析原始碼,取得每篇文章的標題(抓全區熱門文章) #data是網頁的html原始碼 #root表示整份網頁 root=bs4.BeautifulSoup(data,"html.parser")#data是透過網路抓下來的資料(html原始碼)丟給bs4會用html解析 titleLinks = root.find_all("div",class_="c-articleItem__title") page = root.find("a",class_="c-pagination c-pagination--next") for titleLink in titleLinks: titles = titleLink.a.text articleLink = "https://www.mobile01.com/" + titleLink.a["href"] ws.cell(i,1,i) ws.cell(i,2,titles) ws.cell(i,3,articleLink) mWeb.save("mobile.xlsx") request=req.Request(articleLink,headers={ "User-Agent":"Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/106.0.0.0 Mobile Safari/537.36" }) with req.urlopen(request) as response: inner = response.read().decode("utf-8") body = inner.find ("div" ,itemprop = "articleBody") article = body.text ws.cell(i,6,article) print(article) mWeb.save("mobile.xlsx") i = i+1 n = 1 #抓時間作者資料 titleInfos = root.find_all("div",class_="c-articleItemRemark__wAuto") for titleInfo in titleInfos: author = titleInfo.div.a.text timeInfo = titleInfo.div.next_sibling.text ws.cell(n,4,author) ws.cell(n,5,timeInfo) mWeb.save("mobile.xlsx") n = n+1 url = "https://www.mobile01.com/" + page["href"] 但我單把那行抓出來開另個檔案request測試卻又可以抓到文章 root=bs4.BeautifulSoup(data,"html.parser")#data是透過網路抓下來的資料(html原始碼)丟給bs4會用html解析 body = root.find("div" , itemprop="articleBody") article = body.text print(article) 我不太理解為什麼 先謝過回答的各位了 ----- Sent from JPTT on my Samsung SM-N960F. --



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 163.22.18.74 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Python/M.1670951523.A.F7C.html ※ 編輯: livehorse (163.22.18.74 臺灣), 12/14/2022 01:16:19 ※ 編輯: livehorse (163.22.18.74 臺灣), 12/14/2022 01:18:02 ※ 編輯: livehorse (163.22.18.74 臺灣), 12/14/2022 01:30:47 ※ 編輯: livehorse (163.22.18.74 臺灣), 12/14/2022 01:33:00
1F:→ lycantrope: 那不是bs4的find而是str的find 12/14 10:03
2F:→ blc: inner是str 12/14 11:24







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:Tech_Job站內搜尋

TOP