作者x9060000456 (你好)
看板R_Language
标题[问题] 爬虫表格问题
时间Tue Aug 8 21:50:13 2017
[软体熟悉度]:
使用者(已经有用R 做过不少作品)
[问题叙述]:
各位前辈大大大家好,
小弟我最近爬巴哈姆特的文章,
关於哈拉版和新闻都能够爬,
但是到了爬排行榜时, 却爬不出任何结果,
因此上板来求救~ 谢谢!
[程式范例]:
library(rvest)
library(magrittr)
library(httr)
urls <- '
https://acg.gamer.com.tw/index.php?t=1&p=Android'
ranktable <- urls %>% GET(encoding = 'UTF-8') %>% content %>%
html_nodes(css = 'td:nth-child(1)') %>% html_text()
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.161.254.204
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1502200216.A.AAC.html
1F:→ andrew43: 不清楚所谓「排行榜」是指什麽?可以截个图吗? 08/08 23:55
2F:→ x9060000456: 谢谢A大啊! 刚刚小弟我又重新上我内文的urls 08/09 09:10
3F:→ x9060000456: 发现同个网址有两种呈现方式(详细和清单), 如下图 08/09 09:11
6F:→ x9060000456: 昨天主要爬第一张图, 结果完全不能爬 08/09 09:13
7F:→ x9060000456: 今早爬第二张图的内容就可以了! 两张图的css内容不一 08/09 09:18
8F:→ x9060000456: 样, 但urls是同一个! 08/09 09:18
9F:→ x9060000456: 但第一张图的表格还是爬不出来 08/09 09:24
10F:→ LinNine: 清单里面有table,但是详细列表里面没有(改一下selector 08/09 21:46
11F:→ LinNine: 试试看吧 08/09 21:46
12F:→ x9060000456: 谢谢L大~ 之後试了 只有详细列表的CSS才抓的到~ 08/12 16:47