作者oliversu (su)
看板R_Language
标题[问题] 如何exclude 两个vectors重复的数
时间Sun Jan 24 14:30:21 2016
[软体熟悉度]:
入门
[问题叙述]:
我有两个vectors
分别叫做 sampledata与controldata
controldat是从sampledata随机取样3750个
现在我想做一个treatmentdata是把 上述两个vector重复的数字删掉
然而,
因为sampledata里面本身就有重复的数字
如果使用 setdiff这个函数就会发生重复数字被删除两次
例如
sampledata{2,3,2,7,5,8,9,8}
controldata{2,8}
预期得到结果 sampledata{3,2,7,5,9,8}
我也试过%in% 的方式,但发现都无法如预期
由於资料颇大,我无法确认%in%的问题出在哪
希望大家帮帮我
我才刚开始摸索R
感谢大家
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 72.33.2.245
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1453617023.A.8F9.html
1F:→ andrew43: 可以的话不要这样想。应该先有一个包括所有资料的表格。 01/25 02:22
2F:→ andrew43: 其中这个表格必须有ID栏。你现在没有ID,所以怎麽切都会 01/25 02:23
3F:→ andrew43: 不知道哪里出问题。 01/25 02:23
4F:→ andrew43: 又因为你有ID栏,要切资料、取交集联集都会容易很多。 01/25 02:24
5F:→ andrew43: 如果 01/25 02:24
6F:→ oliversu: 谢谢,换个切入点思考就解决了 01/25 14:09