作者MADNUG (就是比你长)
看板R_Language
标题[问题] 读取csv中特定的row
时间Wed Mar 9 10:24:52 2016
[问题类型]:
效能谘询(我想让R 跑更快)
[软体熟悉度]:
使用者(已经有用R 做过不少作品)
[问题叙述]:
小弟有个3.8G多的csv档,但只想要随机读取1/10的row
fread好像没read specific rows的指令,
难道只能读整个档案再select row了吗?
这样好没效率呀.....
若要cross-validation的话光I/O就跑死了....
想请问有没有更效率一点方法呢?
谢谢了
[程式范例]:
参考网路用fread + nrow and skip 写了一下,但是更慢Orz.....
但也是预料中啦XDD
http://pastebin.com/gW9W1GmN
[关键字]:
fread
--
○ "○ ○" ○"
(|\ (|\ )) ))
/`○rz /`○r27\" ○r27\"
○╭○rz ○rz ○rz-st○
 ̄′ ○=^
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 184.6.253.131
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1457490296.A.858.html
※ 编辑: MADNUG (184.6.253.131), 03/09/2016 10:25:30
※ 编辑: MADNUG (184.6.253.131), 03/09/2016 10:27:24
1F:推 sulaxd: 可以参考套件 {ff} 03/09 10:48
2F:→ MADNUG: 谢谢,浏览了一下似乎可以试试!来研究研究 03/09 12:04