作者LinNine (0-9)
看板R_Language
标题Re: [问题] 爬虫表格问题
时间Thu Aug 10 20:48:01 2017
检查他切换『详细』与『清单』的按钮
会看到他在点击『清单』的时候塞cookie --> $.cookie.set('ckACGSHOWTYPE','L')
所以你先塞cookie就可以爬到排行榜table了
library(rvest)
library(magrittr)
library(httr)
urls <- '
https://acg.gamer.com.tw/index.php?t=1&p=Android'
ranktableList <- html_session(urls, set_cookies('ckACGSHOWTYPE' = "L")) %>%
html_nodes(css = 'td:nth-child(1)') %>% html_text() %>% .[-1]
※ 引述《x9060000456 (你好)》之铭言:
: [软体熟悉度]:
: 使用者(已经有用R 做过不少作品)
: [问题叙述]:
: 各位前辈大大大家好,
: 小弟我最近爬巴哈姆特的文章,
: 关於哈拉版和新闻都能够爬,
: 但是到了爬排行榜时, 却爬不出任何结果,
: 因此上板来求救~ 谢谢!
: [程式范例]:
: library(rvest)
: library(magrittr)
: library(httr)
: urls <- 'https://acg.gamer.com.tw/index.php?t=1&p=Android'
: ranktable <- urls %>% GET(encoding = 'UTF-8') %>% content %>%
: html_nodes(css = 'td:nth-child(1)') %>% html_text()
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.246.44.4
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1502369283.A.41D.html
1F:推 x9060000456: 谢谢大大啊!成功了! 08/12 19:59