R_Language 板


LINE

※ 引述《celestialgod (天)》之铭言: : ※ 引述《wmj10054039 (MJ)》之铭言: : : [问题类型]: : : 程式谘询(我想用R 做某件事情,但是我不知道要怎麽用R 写出来) : : [软体熟悉度]: : : 入门(写过其他程式,只是对语法不熟悉) : : [问题叙述]: : : 我目前整理了一份学校所有课程的时间表,想知道不同星期,不同地点,各时段的 : : 人数统计。dataframe资料范例如下: : : 流水号 课程名称 时间 地点 人数 : : 102 A 二3,4四5,7 甲 10 : : 248 B 一1,2,3 乙 20 : : 314 C 三4五7,8,a 丙 5 : : 想请问各位可以用甚麽方法对时间那一栏作字串切割变成以下新的dataframe : : 流水号 课程名称 星期 节次 地点 人数 : : 102 A 二 3 甲 10 : : 102 A 二 4 甲 10 : : 102 A 四 5 甲 10 : : 102 A 四 7 甲 10 : : 248 B 一 1 乙 20 : : 248 B 一 2 乙 20 : : . . : : . . : : . . : : 目前想法只有想到for回圈搭配strspilt,但还是想不到实际写法,麻烦各位指教了,谢谢 : : [环境叙述] : : R version 3.4.2 : 程式: : library(data.table) : library(pipeR) : library(stringr) : dataStr <- "流水号 课程名称 时间 地点 人数 : 102 A 二3,4四5,7 甲 10 : 248 B 一1,2,3 乙 20 : 314 C 三4五7,8,a 丙 5" : removeEmptyFunc <- function(x) x[nchar(x) > 0] : fread(dataStr) %>>% : `[`(j = `:=`(星期 = str_split(时间, "[a-zA-Z0-9,]+") %>>% : lapply(removeEmptyFunc), : 节次 = str_split(时间, "[^a-zA-Z0-9,]+") %>>% : lapply(removeEmptyFunc))) %>>% : `[`(j = .(星期 = unlist(星期), 节次 = unlist(节次)), : by = .(流水号, 课程名称, 地点, 人数)) %>>% : `[`(j = `:=`(节次 = str_split(节次, ","))) %>>% : `[`(j = .(节次 = unlist(节次)), by = .(流水号, 课程名称, 地点, 人数, 星期)) : ## no pipe 程式码 : dataDT <- fread(dataStr) : dataDT[ , `:=`(星期 = lapply(str_split(时间, "[a-zA-Z0-9,]+"), : removeEmptyFunc), : 节次 = lapply(str_split(时间, "[^a-zA-Z0-9,]+"), : removeEmptyFunc))] : tmpDT <- dataDT[ , .(星期 = unlist(星期), 节次 = unlist(节次)), : by = .(流水号, 课程名称, 地点, 人数)] : tmpDT[ , `:=`(节次 = str_split(节次, ","))] : tmpDT[ , .(节次 = unlist(节次)), by = .(流水号, 课程名称, 地点, 人数, 星期)] : 结果: : # 流水号 课程名称 地点 人数 星期 节次 : # 1: 102 A 甲 10 二 3 : # 2: 102 A 甲 10 二 4 : # 3: 102 A 甲 10 四 5 : # 4: 102 A 甲 10 四 7 : # 5: 248 B 乙 20 一 1 : # 6: 248 B 乙 20 一 2 : # 7: 248 B 乙 20 一 3 : # 8: 314 C 丙 5 三 4 : # 9: 314 C 丙 5 五 7 : # 10: 314 C 丙 5 五 8 : # 11: 314 C 丙 5 五 a 我在回应区的问题是想要把如果节次包含3节以上的课程,只取出头跟尾的节次,并且只有 一节课的课程重复两次,也就是说每个课程重复在dataframe的次数都会是偶数倍(主要 目的是想知道每个时段下不同地点会产生的进出人数),举例来说: 流水号 课程名称 时间 人数 地点 102 A 二3,4四5,7 10 甲 248 B 一1,2,3 20 乙 314 C 三4五7,8,a 5 丙 整理成 流水号 课程名称 地点 人数 星期 节次 102 A 甲 10 二 3 102 A 甲 10 二 4 . . . . . . 248 B 乙 20 一 1 248 B 乙 20 一 3 314 C 丙 5 三 4 314 C 丙 5 三 4 314 C 丙 5 五 7 314 C 丙 5 五 a 我目前的想法是利用c大处理我之前问题的方法,将已经把时间拆开成星期跟节次但 还没unlist的节次取出,用回圈搭配条件判断存成新的list再放回data.frame,但发现 这个方法存成的list只会有最後一个元素有值,其他都是NULL。想请教是哪边有错误, 或是有更好的解决方法,谢谢。 [程式范例] oldlist = df$节次 newlist = list() for (i in length(oldlist)) { if (length(oldlist[[i]]) == 1){ newlist[[i]] = rep(oldlist[[i]][1], 2) }else if (length(oldlist[[i]]) == 2){ newlist[[i]] = c(oldlist[[i]][1], oldlist[[i]][2]) }else if (length(oldlist[[i]]) == 3){ newlist[[i]] = c(oldlist[[i]][1], olslist[[i]][3]) } } --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.112.25.121
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1528278141.A.A02.html
1F:→ wmj10054039: 我知道哪边写错了 感谢~ 06/07 20:44







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:iOS站内搜寻

TOP