作者spiderway (spiderway)
看板R_Language
标题[问题] 处理资料 效能询问
时间Mon Jul 4 22:48:59 2016
- 问题: 当你想要问问题时,请使用这个类别
[问题类型]:
效能谘询(我想让R 跑更快)
[软体熟悉度]:
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
大家好,
最近因为需要要处理一些资料,虽然有写出要的东西,但是实在是跑太慢了,感觉要跑个
几年= =,一定是我写法不好,想来这问一下各位大大该怎个改才对,并学习一下
麻烦各位大大给予小鲁指导,感激不尽!!!
程式:
读取了全部CSV(10万多个)存在一个大大的list里面,要做的大概是把每一个list里面的
资料都做同一件事,就是每5笔整理成1笔,然後append在一起,如下
1 2 3 4 5 6 1 2 3 ....
1 6/1 a b 12 1 2 1 6/1 a b 12 1 2 13 1 3 14 1 4 15 1 5 16 1 6
2 6/1 a b 13 1 3
3 6/1 a b 14 1 4 变成1笔>>>
4 6/1 a b 15 1 5
5 6/1 a b 16 1 6
[程式范例]:
http://pastie.org/10898589
[版本]
R version 3.3.0 (2016-05-03)
Platform: x86_64-pc-linux-gnu (64-bit)
Running under: Ubuntu 14.04.4 LTS
[关键字]:
--
Sent from my ibon.
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 122.116.200.29
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1467643744.A.057.html
※ 编辑: spiderway (122.116.200.29), 07/04/2016 22:51:34
2F:→ Edster: 看看,你原本的方式很吃记忆体。一个资料变成三个资料存着 07/04 23:51
3F:→ Edster: 存着等着被读取,然後重复的动作, as.factor 跟t做很多次 07/04 23:52
4F:推 Edster: 还有value, new_value在每次回圈没有重新reset,会越来越大 07/04 23:56
好的,学到很多 我的写法实在是太逊了 Q_Q
※ 编辑: spiderway (122.116.200.30), 07/05/2016 22:40:01