作者Wush978 (拒看低质媒体)
看板R_Language
标题[心得] 中文编码处理
时间Sat Nov 14 01:20:57 2015
[关键字]: R, Encoding
[重点摘要]:
上个月我在台大授课时撰写了一份swirl 教材:
https://github.com/wush978/DataScienceAndR
其中 RBasic-07-Loading-Dataset 写了目前我知道的数个R 处理Encoding的方法。
由於坊间比较少解决载入中文资料的R 教材,
而且我今天晚上才刚更新这门课程的内容,需要有网友帮忙测测看相容性。
所以希望有任何想了解如何解决中文资料编码问题的网友,可以一边学,一边帮我测。
以下列出教材中有提到的部分:
1. file + 参数 encoding
- 在windows上遇到如UTF-16仍然会出错
2. readBin + stringi::stri_encode + textConnection + 参数 encoding
- 目前可以解决我手上所有中文的状况,但是效能稍差
有兴趣帮忙测试的网友,
请依照README的只是安装课程之後,直接进入RBasic-07-Loading-Dataset进行课程。
有任何问题或feedback(安装看不懂、解释看不懂、电脑爆炸...)
欢迎截图贴到
https://github.com/wush978/DataScienceAndR/issues 开issue给我
先谢谢各位
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 118.161.31.173
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1447435261.A.79B.html
※ 编辑: Wush978 (140.109.127.9), 11/14/2015 11:43:42
1F:推 cywhale: stringi+encoding help in many cases~ Thanks sharing~ 11/14 18:20