R_Language 板


LINE

※ 引述《ror (回血375)》之铭言: : [问题叙述]: : 请简略描述你所要做的事情,或是这个程式的目的 : 各位前辈好 : 想请教一个问题 : 目前我手上有大概几百万(快到千万)组资料 一组资料是两笔内容 : 现在要对每一组资料跑lm()回归後 取出相关系数与P-value 等等资讯 : 但因为要跑的量实在是太大量了 导致速度很慢 已经使用parallel : 目前写法是 loop-> lm() ->summary-> 取出value : 想请问是否有方式避免重复宣告lm()物件 ...或是其他可以提升速度的方式 : 感谢 Orz 以下可能跟原PO的问题关系小了一点XD 我提供一个利用RcppArmadillo and RcppParallel做 leave-one-out cross validation (LOOCV) 的例子 十万个样本做LOOCV: 程式:http://pastebin.com/4JK6VSd7 在我的电脑上跑一次花了173.79秒 (平均一次 0.17 milliseconds) 这个应该远比用R的回圈快很多... 记忆体使用的部分也保持在300MB以下,基本上不太会用到太多记忆体做暂存 给一个简单的比较: mses = vector('numeric', N) st = proc.time() for (i in 1:N){ coef_lm = coef(lm.fit(cbind(1, X[-i,]), y[-i])) mses[i] = y[i] - c(1, X[i,]) %*% coef_lm } proc.time() - st 上面的程式在N = 5000大概花10秒,Rcpp的版本只需要0.3秒 题外话,Rcpp真的值得一学,如果想要直接使用R的BLAS可以考虑RcppArmadillo 如果觉得内建的BLAS太慢可以考用RcppEigen (他本身的BLAS也算是够快的) 不过最简单的方式就是用RRO,或是在linux/mac上也可以考虑openblas 最後再搭配RcppParallel就可以得到很大的加速了XDD PS: 里面有一段程式是避免RcppParallel跟RRO使用的MKL用到过多的thread 而造成速度的拖累,所以写了一段去减少MKL使用的thread 在有超执行绪(HT)的电脑上,MKL会用2个,其余则是使用1个thread PS2: RRO是Revolution R Open 最後,原PO的问题也并不复杂,相关系数跟p-value可以分别透过 RcppArmadillo:::cor跟Rcpp:::pt做处理,如果有任何问题,欢迎讨论XD Rcpp:::pt用法: http://stackoverflow.com/questions/20144528/how-use-correctly-rcpppt 补充,如果要用K-fold可以用下面的函数去生成cvIndex: (刚好有现成的,顺便分享XD) 好读版:http://pastebin.com/RhJx3kLs uvec cvfold_index_f(const uword n, const uword fold) { uword fold_n = n / fold, rem = n - fold_n * fold; uvec tmp_vec = linspace<uvec>(0, fold - 1, fold), index = vectorise(repmat(tmp_vec, fold_n, 1)); if (rem > 0) index = join_cols(index, index.head(rem)); // random permutation int j; for (int i = 0; i < n; i++) { j = as_scalar(randi<uvec>(1, distr_param(i, n - 1))); index.swap_rows(i, j); } return index; } --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.109.73.190
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1446441482.A.931.html
1F:推 cywhale: 教学文大推~感谢分享~~ 11/02 14:00
※ 编辑: celestialgod (140.109.73.190), 11/02/2015 14:45:48
2F:推 ror: 很感谢C大热心的提供!以及每位帮助我的人 正在努力学习中QQ 11/02 18:14







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:iOS站内搜寻

TOP