作者celestialgod (天)
看板R_Language
标题Re: [问题] 多个变数的回圈如何处理?
时间Sat Dec 24 09:54:47 2016
※ 引述《lovedmagic (EricZou)》之铭言:
: [问题类型]:
: 程式谘询(我想用R 做某件事情,但是我不知道要怎麽用R 写出来)
: [软体熟悉度]:
: 新手(没写过程式,R 是我的第一次)
: [问题叙述]:
: 目前我遇到的困难是我有A1~A270个变数,我每个变数都有大概五个数值,
: 每个数值左侧代表一个名称,例如我A1这个变数里面有 34 18 16 9 4五个值
: 然後每个数值对应到左侧的名称有A B C D E ,我想做的就是取出A1变数中
: 最大的那个值,然後再取出左侧的ID,主要是要求出左侧的ID,我要如何
: 让回圈把每个变数都跑过一次呢???
: 以下有错误范例
: [程式范例]:
: fxck = data.frame()
: for (i in 1:270){
: number[data$Ai==max(data$Ai)]
: fxck <- rbind(number[Ai==max(Ai)],Ai)
: print(fxck)
: }
: [关键字]:
: 多个变数、回圈
library(data.table)
DT <- data.table(name = LETTERS[1L:5L], matrix(rnorm(270L * 5L), 5L))
setnames(DT, paste0("V", 1L:270L), paste0("A", 1L:270L))
# direct:
data.table(
variable = paste0("A", 1L:270L),
ID = as.character(DT[ , lapply(.SD, function(x) name[which.max(x)]),
.SDcols = A1:A270])
value = as.numeric(DT[ , lapply(.SD, max), .SDcols = A1:A270])
)
# variable ID value
# 1: A1 B 0.5974676
# 2: A2 A 1.6205859
# 3: A3 E 0.9247647
# 4: A4 A 1.7180776
# 5: A5 D 1.2060909
# ---
# 266: A266 C 0.4813518
# 267: A267 B 1.3096330
# 268: A268 B 0.4504671
# 269: A269 C 0.7401682
# 270: A270 D 2.9256539
# melt:
library(pipeR)
out <- melt.data.table(DT, 1) %>>%
`[`( , .(ID = name[which.max(value)], value = max(value)) ,
by =.(variable))
# variable ID value
# 1: A1 B 0.5974676
# 2: A2 A 1.6205859
# 3: A3 E 0.9247647
# 4: A4 A 1.7180776
# 5: A5 D 1.2060909
# ---
# 266: A266 C 0.4813518
# 267: A267 B 1.3096330
# 268: A268 B 0.4504671
# 269: A269 C 0.7401682
# 270: A270 D 2.9256539
# melt 2:
out <- melt.data.table(DT, 1) %>>%
`[`( , `:=`(maxRow = rank(value) == length(value)), by = .(variable)) %>>%
`[`(maxRow == TRUE) %>>% `[`( , maxRow := NULL)
# tidyr + dplyr
library(tidyr)
library(dplyr)
library(pipeR)
gather(DT, variable, value, -name) %>>% group_by(variable) %>>%
filter(rank(value) == length(value))
--
R资料整理套件系列文:
magrittr #1LhSWhpH (R_Language) https://goo.gl/72l1m9
data.table #1LhW7Tvj (R_Language) https://goo.gl/PZa6Ue
dplyr(上.下) #1LhpJCfB,#1Lhw8b-s (R_Language) https://goo.gl/I5xX9b
tidyr #1Liqls1R (R_Language) https://goo.gl/i7yzAz
pipeR #1NXESRm5 (R_Language) https://goo.gl/zRUISx
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 36.232.186.178
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1482544491.A.66E.html
1F:推 f496328mm: 好高级的处理方法阿 12/24 15:12
2F:推 lovedmagic: 完全想像不到的高度 12/24 15:32
3F:→ lovedmagic: 跑了一次卡在.SDcols这边,仍在研究 12/25 18:00
.SDcols就是你要放的变数,可以用字串向量表示:c("A1", "A2")这样
※ 编辑: celestialgod (1.165.234.127), 12/25/2016 18:36:05
4F:→ lovedmagic: 那请问C大我有270个变数就要手动输入A1~A270吗?? 12/26 10:22
5F:→ lovedmagic: 看了一下还是不太能够理解,我如果自己就有资料的话 12/26 11:33
6F:→ lovedmagic: 那我必须要自己把变数怎麽样灌进去呢?单纯的apply我试 12/26 11:34
7F:→ lovedmagic: 了apply(data , 2 , max )但是跑出来的依然不是我想要 12/26 11:35
8F:→ celestialgod: 利用适当的方法填入就好了 12/26 18:52