作者z5f (颗颗)
站内Statistics
标题[程式] Stata 资料处理
时间Mon Apr 13 20:49:59 2015
[软体程式类别]:
stata
[程式问题]:
资料处理
[软体熟悉度]:
中(3个月到1年)
[问题叙述]:
如下
[程式范例]:
虽然张贴程式很可怕,但基本上有些程式还是要张贴才能解决
*教育程度
*国中以下
sum x if (dedu1==0 & dedu2==0 & dedu3==0)
*高中职
sum x if dedu1 == 1
*大学、专科
sum x if dedu2 == 1
*硕博士
sum x if dedu3 == 1
我想要把 x 这个变数,根据不同的subsample算他们的平均值,
然後再把平均值排成表格的形式 例如:
0.23435
0.45435
0.43654
0.34543
目前是想到用sum 之後 r(mean) 存成新的变数
可是这样我每一个r(mean)都要取一次别的名字
因为我不只教育这个分类的subsample,还有很多其他分类的subsample都要算x的平均值
如果一个一个取太耗工夫了
本来想用foreach 代替 if 後的变数 但因为我是dummy variable
会遇到基准组的问题 好像又很麻烦
所以想问问看有没有什麽方法或指令 可以不用取名字就直接算出我想要的表格形式?
谢谢
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 117.19.131.254
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1428929401.A.726.html
1F:→ riirene: collapse (mean) x, by(dedu1 dedu2 dedu3) 04/13 22:28
2F:→ riirene: 建议资料先存档,-collapse-会只留下整理过後的资料 04/13 22:28
3F:→ riirene: by dedu1 dedu2 dedu3, sort: summarize x 04/14 09:48
4F:→ riirene: 不用更改资料内容 04/14 09:48
谢谢 不过虽然可以一次看到这4个平均值
但还有什麽方便的方法可以把他们一次抓出 方便後续运算吗?
※ 编辑: z5f (117.19.129.179), 04/15/2015 10:34:03
5F:推 Yukirin: dedu这系列的变数感觉是从edu之类的原始资料生出来的 04/15 22:49
6F:→ Yukirin: 那就生一个单一的分组变数 然後 mean x, over(eduGroup) 04/15 22:49
7F:→ porfu: 类似楼上,可以用table edugroup,c(mean x) 04/16 07:42
8F:→ porfu: 比较有弹性。当然用mean x的好处是结果会存在e(b)里头。 04/16 07:44