R_Language 板


LINE

ctrl + y 可以删除一整行,请将不需要的内容删除 文章分类提示: - 问题: 当你想要问问题时,请使用这个类别 [问题类型]: 程式谘询(我想用R 做某件事情,但是我不知道要怎麽用R 写出来) [软体熟悉度]: 请把以下不需要的部份删除 入门(写过其他程式,只是对语法不熟悉) [问题叙述]: 想撷取 http://www.cwb.gov.tw/V7/climate/monthlyData/mD.htm 天气资料,但由於天气的资料会依网页上所选取的下拉式选单的值而有所变化 想请问各位先进,要如何让R自动会带值选取对应的资料? 例如: 2013年3月阿里山的平均温度为9.9度 2013年4月阿里山的平均温度为11.3度 谢谢 [环境叙述]: 请提供 sessionInfo() 的输出结果, 里面含有所有你使用的作业系统、R 的版本和套件版本资讯, 让版友更容易找出错误 R version 3.2.4 Revised (2016-03-16 r70336) Platform: x86_64-w64-mingw32/x64 (64-bit) Running under: Windows 7 x64 (build 7601) Service Pack 1 locale: [1] LC_COLLATE=Chinese (Traditional)_Taiwan.950 LC_CTYPE=Chinese (Traditional)_Taiwan.950 LC_MONETARY=Chinese (Traditional)_Taiwan.950 [4] LC_NUMERIC=C LC_TIME=Chinese (Traditional)_Taiwan.950 attached base packages: [1] stats graphics grDevices utils datasets methods base loaded via a namespace (and not attached): [1] httr_1.1.0 magrittr_1.5 R6_2.1.1 tools_3.2.4 RCurl_1.95-4.8 yaml_2.1.13 rappdirs_0.3 memoise_0.2.1 crayon_1.3.1 swirl_2.3.1-2 [11] stringi_1.0-1 stringr_1.0.0 digest_0.6.8 testthat_0.11.0 bitops_1.0-6 -- --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.168.242.6
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1462153221.A.953.html ※ 编辑: corel (1.168.242.6), 05/02/2016 09:41:09
1F:→ andrew43: 其实它只是靠iframe在呼叫不同的静态网页而已。 05/02 10:56
2F:→ andrew43: 你仔细看原始码就可发现呼叫的静态网页网址及规则。 05/02 10:58
3F:→ andrew43: 例如 ./Data/mD20161.htm 就是 2016 一月。 05/02 10:58
4F:→ corel: 感谢,原来还有这一个方法,刚刚还在研究RSelenium解法 05/02 11:17
5F:→ andrew43: 中央气象局非常多的网页资料都用类似方法(选单控制 05/02 11:54
6F:→ andrew43: iframe对象而iframe内是可直接读取的静态html)。 05/02 11:55
7F:→ andrew43: 之前练习台风和地震的历史记录,都可以这样搞。 05/02 11:56
8F:→ andrew43: 本来我很恨iframe的,不过这种情况的iframe就很可爱了:) 05/02 11:57
目前就依 andrew43大大 建议用静态方式去抓取 doc <- htmlParse("http://www.cwb.gov.tw/V7/climate/monthlyData/Data/mD201512.htm") tableNodes <- getNodeSet(doc, "//table") tb <- readHTMLTable(tableNodes[[2]]) 资料的确是读取下来了 但请教如何把每一笔 row 值各别储存出来? 例如: 阿里山, 9.8, 18.0/5 .... 等 谢谢 ※ 编辑: corel (1.168.242.6), 05/02/2016 12:16:33 ※ 编辑: corel (1.168.242.6), 05/02/2016 12:22:29
9F:→ andrew43: tb 已经是 data.frame 了,就 tb[第几列, 第几栏] 这样 05/02 13:35
10F:→ andrew43: 或 tb[第几列, ] 取整列而 tb[, 第几栏] 取整栏 05/02 13:36
11F:→ andrew43: 只是基本的 data frame 取值而已。这是你想问的吗? 05/02 13:37
没错,不过刚刚我太纠结於 a <- tb[23,1] class(a) 印出来的 class 是 "factor"的问题 只不过我又延伸出另一个问题 home <- "http://www.cwb.gov.tw/V7/climate/monthlyData/mD.htm" home <- htmlParse(home, encoding ="UTF-8") 抓出来是乱码... 我有查网页中的语言编码是 utf-8 可是抓出来就是乱码? 请问该如何修正,谢谢 ※ 编辑: corel (1.168.242.6), 05/02/2016 14:15:36 ※ 编辑: corel (1.168.242.6), 05/02/2016 14:16:27
12F:→ corel: 不好意思问题有一点多... 05/02 14:20
13F:→ celestialgod: windows用stri_conv转到big5显示才会正常 05/02 14:36
14F:→ andrew43: factor是因为自动把字串栏转成因子,但这通常没关系, 05/02 15:07
15F:→ andrew43: 硬要转回字串就套 as.character() 就好了。 05/02 15:07







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:Gossiping站内搜寻

TOP