作者frojet (Lucy Lee)
看板R_Language
标题[问题] 如何内容资料转置成栏位名称来计算
时间Mon Mar 18 17:11:46 2019
[问题类型]:
程式谘询(我想用R 做某件事情,但是我不知道要怎麽用R 写出来)
[软体熟悉度]:
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
我有一组近5万笔资料,格式如下
每笔"门诊序号"就是一次看诊纪录,"处置代码"为某个药品代号
每个病人看诊,都会开立1~5种不等药品。
https://i.imgur.com/UXNj7M6.jpg
原始资料如左图,但我想转换资料排版(如右图)
将药品代号转换成每一个栏位,
根据原资料有开立该药品,则在该栏成 注记成 Yes
方便我後续能统计特定药品使用频率
[程式范例]:
不知道如何写?
[环境叙述]:
windows 10
R version 3.4.4
[关键字]:
--
当你指责别人时,不要忘记
一指指向别人,四指是指向自己 ~frojet~
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 110.50.136.241
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1552900311.A.18D.html
※ 编辑: frojet (110.50.136.241), 03/18/2019 17:19:39
1F:推 locka: 所以所有药品(1:n)要变成栏位X2到Xn是吗? 03/18 17:55
2F:→ locka: 门诊序号会不会重复? 03/18 17:55
3F:→ frojet: 门诊序号不会重复 03/18 18:11
4F:→ frojet: 如果能把上百个药品名称都转换各别栏位是最棒的。 不过 03/18 18:18
5F:→ frojet: 我这里目前分析需求,其实只要抓出其中六个药品来对应统 03/18 18:18
6F:→ frojet: 计(如我图上 绿色 和红色的药品)是目前要分析的项目 03/18 18:18
8F:→ cywhale: 看起来适用melt, dcast来解,这类问题应该提供部分资料较 03/18 22:29
9F:→ cywhale: 方便解答...,只有img, 里头资料又很特殊,很难自动产生 03/18 22:31
10F:→ cywhale: 题外话前日再用dcast使用自订fun.aggregat意外踩到一bug 03/18 22:32
12F:→ frojet: 谢谢各位,是说 我要如何提供一小部分资料? 03/19 04:23
13F:→ frojet: 各位通常会建议上传至那个网站,供人 03/19 04:23
14F:→ frojet: 下载 03/19 04:23
15F:→ tcn1john: 如果先把处置代号paste起来合并成一栏,再用grep抓药名 03/19 14:35
16F:→ tcn1john: 不知道如何? 03/19 14:35
17F:→ andrew43: 云端空间随便一个都可以,把敏感资料保护或隐敝好就行 03/19 23:11
19F:→ andrew43: 回楼上,这不太稳健,要确定pattern只会抓到完整名才行 03/20 08:42
20F:→ Meng24: 我想到很土法炼钢的方式XD 03/20 13:16
21F:→ Meng24: 新建一个栏位名称是药品名的栏位 03/20 13:16
22F:→ Meng24: 然後用中括号选出你的处置代码中有药品的门诊号码 再将这 03/20 13:16
23F:→ Meng24: 些门诊号码的药品名栏位填入yes就好了 03/20 13:16