作者vicror84 (阿汘)
看板R_Language
标题[问题] table问题
时间Sun Jun 5 20:23:26 2016
请问我想把亚东健检中心(
http://depart.femh.org.tw/HMC/wholebody.html)的表格爬下
来,但会出现乱码在windows系统中,使用R语言,抓取表格呈现出乱码,
我们将格式转为繁体,
还是会呈现乱码,我们研究出所有BIG5编码的网页,转换後,还是乱码,
程式如下:
library(XML)
URL = paste0("
http://depart.femh.org.tw/HMC/wholebody.html")
doc<-htmlParse(URL,encoding="UTF-8")
tables<-readHTMLTable(doc,header=T,which = 2)
tables
dim(tables)
View(tables)
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.42.187.234
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1465129416.A.876.html