[问题] read.table 多个sep 遗失值miss

时间Sun May 1 00:35:19 2016

问题一我要读的是笔记本txt档档案太大无法先用excel处理我的分隔符号有多个请问要怎麽写?? 我的code read.table("d:\\xxx.txt" ,sep=";", fill=T, quote="") 我想要用 ; 和空格当作分隔符号未来可能再增加 ========================================================== 问题二我的资料中有些地方没有值所以当初在存的时候就直接忽略连空白都没留像这样: sam;16;boy; 2015:00:09:59 green;18;gril paul;20; 2015:00:09:59 第一行是name 第二行是age 第三行是性别但是paul没有记录到所以直接记录到第四行的time green的time也没记录到想问有没有什麽方法解决我目前只想到比较笨的方法给它特定范围去判断像性别不是boy就是gril 出现其他就给他NA 还有这样读资料也会因为每列资料col都不一样有的时候会出现问题是可以读成文字再去慢慢拆开不过有点笨就是了最後想问如果读资料量上百万笔还是用read.table吗? 有没有比较好的函数专门处理large data? 谢谢 --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 220.137.162.5 ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1462034121.A.29E.html

1^F：→ andrew43: 先考虑 data.table package 的 data.table 和 fread 05/01 00:55

2^F：→ andrew43: 这在大资料有利，但还是要先解决各列不齐一的问题。 05/01 01:04

3^F：→ andrew43: 目前我觉得拆开各列来解似乎是不可必免的，因为在逻级上 05/01 01:07

4^F：→ andrew43: 判别哪个栏位要给NA是你来设计的。 05/01 01:09

5^F：→ andrew43: 所以核心问题可能变成怎麽有效率且稳健地整理大量字串。 05/01 01:10

感谢这部分可能会直接撷取分号与分号中的字串然後去比对那问题一大大知道吗? 当然也可以变成字串自己再去解开分号内的东西只是感觉整个程式会变得很笨重 ※ 编辑: f496328mm (220.137.162.5), 05/01/2016 01:25:25

6^F：→ andrew43: 第一个问题我想还是要先字串处理後再丢给现成func才行。 05/01 02:17

7^F：→ andrew43: 因为指定多於一个字符可能会很麻烦，所以主流func不做。 05/01 02:19

8^F：→ andrew43: 例如你很难精确地说"a b ;c; d"的结果是什麽。 05/01 02:21

9^F：→ andrew43: 所以我觉得指定reg expr自己切会简单很多。 05/01 02:27

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

R_Language 板

[问题] read.table 多个sep 遗失值miss

热门看板

赞助商连结