作者memphis (让你喜欢这世界~)
看板R_Language
标题Re: [问题] 一笔资料转多笔
时间Fri Dec 2 15:30:49 2016
我只有普通版的
library(dplyr)
tmp <- data.frame(id=c(1,2,3), start_y=c(100,101,101), start_s=c(1,2,2),
end_y=c(102,103,101), end_s=c(2,1,2), stringsAsFactors=F)
myfun <- function(v){
v <- as.vector(v)
out <- data.frame(id=v[1], year=rep(seq(v[2], v[4]), each=2),
s=c(1,2), stringsAsFactors=F)
if(v[3]==2) out <- out[-1,]
if(v[5]==1) out <- out[-nrow(out),]
return(out)
}
tmp2 <- apply(tmp,1,myfun)
#out <- do.call("rbind", tmp2)
out <- bind_rows(tmp2)
out
※ 引述《criky (立业成家)》之铭言:
: [问题类型]:
:
: 程式谘询(我想用R 做某件事情,但是我不知道要怎麽用R 写出来)
: [软体熟悉度]:
: 新手(没写过程式,R 是我的第一次)
: [问题叙述]:
: 若我有资料栏位如下:
:
: id start_y start_s end_y end_s
: 1 100 1 102 2
: 2 101 2 103 1
: 3 101 2 101 2
: year:
: 如何转成下面的样子:
: id year s
: 1 100 1
: 1 100 2
: 1 101 1
: 1 101 2
: 1 102 1
: 1 102 2
: 2 101 2
: 2 102 1
: 2 102 2
: 2 103 1
: 3 101 2 (只有一笔)
: 谢谢回答~
: [程式范例]:
:
:
: [环境叙述]:
:
: 请提供 sessionInfo() 的输出结果,
: 里面含有所有你使用的作业系统、R 的版本和套件版本资讯,
: 让版友更容易找出错误
:
: [关键字]:
:
: 选择性,也许未来有用
:
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.109.73.105
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1480663852.A.EC0.html
※ 编辑: memphis (140.109.73.105), 12/02/2016 15:31:42
1F:→ celestialgod: apply应该会慢到想哭 12/02 15:35
2F:→ memphis: 我只会这招阿..如果资料量很大 apply 直接改成平行就好 12/02 15:49
3F:推 f496328mm: 我以前也是用apply开平行,但上面那些大大的方法,真 12/02 15:53
4F:→ f496328mm: 的会比较好,我现在也很少开平行了 12/02 15:53
5F:→ f496328mm: 我以前也是自己写函数去做,不过资料量大,开平行还是 12/02 15:54
6F:→ f496328mm: 慢,真的会跑到想哭 12/02 15:54
7F:→ celestialgod: 看有没有人要来个benchmark 12/02 16:08
8F:→ memphis: 我猜你的应该会快吧 准备一个清单用框的 好像步骤比较少 12/02 16:38
9F:推 huangsam: 可以问一下平行慢的原因吗? 12/02 20:01
10F:→ obarisk: 平行运算有其它cost 12/02 20:04
11F:→ obarisk: 但楼上大大应该是指自己平行比用别人写好的非平行慢 12/02 20:05
12F:→ celestialgod: 没有平行的程式多数背後是c++而非R,会相对快乐不少 12/02 20:47
13F:→ celestialgod: 而且windows的R平行是开slave,需要花不少时间传资 12/02 20:48
14F:→ celestialgod: 料,linux的multicore,我就不确定了 12/02 20:48
15F:推 f496328mm: 背後是C++的真的很快 楼上说到重点 平行要传资料 12/03 12:02
16F:→ f496328mm: 传资料占记忆体,如果资料占1G就好,平行开8核心 12/03 12:03
17F:→ f496328mm: 就会占8G,光传资料就死人了,况且你还要做运算 12/03 12:04
18F:→ f496328mm: 况且有些C++写的好,会帮你用8核心去跑 12/03 12:05
19F:→ f496328mm: CPU常常跑到100%真的很爽XD 12/03 12:06
20F:→ f496328mm: 当然平行是没有办法中的办法 我有的时候还是会用 12/03 12:06