Re: [问题] 资料长<->宽变换

时间Sat Aug 13 13:08:02 2016

※ 引述《DrRd (就这样吧)》之铭言： : [问题类型]: : : 意见调查(我对R 有个很棒的想法，想问问大家的意见) : : [软体熟悉度]: : : 入门(写过其他程式，只是对语法不熟悉) : [问题叙述]: : : 要将宽型的资料转成长型的资料，但是要合并成的新变项有两个 : 以iris为例 : 本来iris的资料长这样 : | Sepal.Length | Sepal.Width | Petal.Length | Petal.Width | Species | : |:------------:|:-----------:|:------------:|:-----------:|:-------:| : | 5.1 | 3.5 | 1.4 | 0.2 | setosa | : | 4.9 | 3.0 | 1.4 | 0.2 | setosa | : | 4.7 | 3.2 | 1.3 | 0.2 | setosa | : | 4.6 | 3.1 | 1.5 | 0.2 | setosa | : 我想要转成 : | Species | SorP.x | Length | Width | : |:-------:|:------------:|:------:|:-----:| : | setosa | Sepal | 5.1 | 3.5 | : | setosa | Sepal | 5.1 | 3.0 | : | setosa | Pepal | 5.1 | 3.2 | : | setosa | Pepal | 5.1 | 3.1 | : | setosa | Sepal | 5.1 | 3.6 | : 目前我想到的作法是先弄出两个长期的资料，一个是Length另一个是Width : 然後再把两个merge起来，请问大家有没有什麽其他的方法？可以不用先弄成两个资料？ : : [程式范例]: : : data("iris") : head(iris) : library(tidyr);library(dplyr) : aa <- merge( : gather(iris[-c(2,4)],key = SorP, value = Length, Sepal.Length, Petal.Length), : gather(iris[-c(1,3)],key = SorP, value = Width, Sepal.Width, Petal.Width), : by.x = "Species", by.y = "Species") : : [环境叙述]: : : R version 3.3.0 (2016-05-03) : Platform: x86_64-apple-darwin13.4.0 (64-bit) : Running under: OS X 10.11.6 (El Capitan) : : [关键字]: : : 资料格式、tidyr 好读版：http://pastebin.com/Lei4AzsU 两个方法都可以达成，重点是unique key - id的建立 1. data.table library(data.table) library(pipeR) resDT <- iris %>>% data.table %>>% transform(Species = as.character(Species), id = 1:nrow(.)) %>>% melt(id = 5:6, measure = c(1:4), variable.factor = FALSE) %>>% `[`( , `:=`(c("partName", "measure"), tstrsplit(variable, "\\."))) %>>% dcast.data.table(Species + partName + id~ measure, sum, value.var = "value") %>>% `[`( , id := NULL) # Species partName Length Width # 1: setosa Petal 1.4 0.2 # 2: setosa Petal 1.4 0.2 # 3: setosa Petal 1.3 0.2 # 4: setosa Petal 1.5 0.2 # 5: setosa Petal 1.4 0.2 # --- # 296: virginica Sepal 6.7 3.0 # 297: virginica Sepal 6.3 2.5 # 298: virginica Sepal 6.5 3.0 # 299: virginica Sepal 6.2 3.4 # 300: virginica Sepal 5.9 3.0 2. dplyr + tidyr library(pipeR) library(dplyr) library(tidyr) resTbl <- iris %>>% tbl_df %>>% mutate(id = 1:nrow(.)) %>>% gather(variable, value, -Species, -id) %>>% separate(variable, c("partName", "measure")) %>>% spread(measure, value) %>>% select(-id) # Source: local data frame [300 x 4] # # Species partName Length Width # <fctr> <chr> <dbl> <dbl> # 1 setosa Petal 1.4 0.2 # 2 setosa Sepal 5.1 3.5 # 3 setosa Petal 1.4 0.2 # 4 setosa Sepal 4.9 3.0 # 5 setosa Petal 1.3 0.2 # 6 setosa Sepal 4.7 3.2 # 7 setosa Petal 1.5 0.2 # 8 setosa Sepal 4.6 3.1 # 9 setosa Petal 1.4 0.2 # 10 setosa Sepal 5.0 3.6 # .. ... ... ... ... -- R资料整理套件系列文： magrittr #1LhSWhpH (R_Language) http://tinyurl.com/j3ql84c data.table #1LhW7Tvj (R_Language) http://tinyurl.com/hr77hrn dplyr(上) #1LhpJCfB (R_Language) http://tinyurl.com/jtg4hau dplyr(下) #1Lhw8b-s (R_Language) tidyr #1Liqls1R (R_Language) http://tinyurl.com/jq3o2g3 --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 36.233.82.44 ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1471064884.A.2D4.html ※ 编辑: celestialgod (36.233.82.44), 08/13/2016 13:18:14

1^F：→ DrRd: 十分详细，我再研究一下spread。感谢版主 08/13 21:52

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

R_Language 板

Re: [问题] 资料长<->宽变换

热门看板

赞助商连结