作者swilly0906 (史威利哥哥)
看板R_Language
标题[问题]使用read.csv一直出现错误讯息
时间Wed Jun 7 00:58:45 2017
[问题类型]:
[软体熟悉度]:
新手(没写过程式,R 是我的第一次)
[问题叙述]:
请简略描述你所要做的事情,或是这个程式的目的
[程式范例]:
针对政府开放资料里面的这个csv档:紫外线监测data
http://data.gov.tw/node/6076
我第一步骤就失败了QQ
我的指令如下:
uv <- read.csv("UV_20170606233938.csv",sep = ",",encoding = "UTF-8")
结果跑出错误讯息如下:
Error in type.convert(data[[i]], as.is = as.is[i], dec = dec, numerals =
numerals,:invalid multibyte string at '<e8><8a><b1>?<ae>'
不是很懂这个错误讯息..
拿去喂狗之後,stackoverflow也有差不多的问题,可是我照着做
好像还是失败了....
[环境叙述]:
R version 3.3.1 (2016-06-21)
Running under: Windows 7 x64 (build 7600)
[关键字]:
选择性,也许未来有用
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 115.43.83.205
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1496768328.A.D8F.html
1F:→ andrew43: windows os吗?请先爬文,关键字「中文」 06/07 02:37
2F:→ andrew43: 不过文字编码确实是utf8没错 06/07 02:38
4F:→ swilly0906: 终於成功了 谢谢楼上大大:) 06/07 10:35
5F:→ andrew43: 可以的话欢迎分享除虫过程,谢谢。 06/07 11:31
成功是成功啦~
但我还是不知道原理是什麽
希望andrew43或其他大大很替我解惑
我用Notepad++ 编码部分选"切换至UTF-8码格式(档首无BOM)"
存档之後
接着回R
指令改为:read.csv("UV_20170607233938.csv",fileEncoding =
"UTF-8",sep = "\t")
就成功了 然後後续动作都没问题
只是还是似懂非懂 不知道为何这样就可以成功...
至少我今天学到了
有问题就回Notepad++ debug一下94了QQ
※ 编辑: swilly0906 (115.43.83.205), 06/07/2017 23:09:28
6F:→ andrew43: 看来似乎是BOM。这应该是windows user的麻烦。 06/08 00:53
7F:→ andrew43: 多谢你回应。 06/08 00:53
8F:→ andrew43: 这个csv档在linux和mac都直接用没碰到问题。 06/08 00:55