作者lohas501 (wiikobe)
看板Statistics
标题[程式] SAS删除多家年份不齐全之公司
时间Wed Apr 8 21:14:02 2015
[软体程式类别]:sas
[软体熟悉度]:低(1~3个月)
[问题叙述]:
各位大大,小弟想请教资料整理的问题,因为我的资料需要一家公司完整2005年01月至
2013年12月,共9年期间的资料,但某些公司存在年份可能会是2004年01月至2008年12月
,我该如何剔除年份不完整的公司?
原资料呈现(片段部分)
公司 year month
1 2005 01
1 2005 02
. . .
. . .
1 2008 01
. . .
1 2013 11
1 2013 12
2 2004 01
. . .
. . .
2 2005 01
. . .
2 2008 12
我目前想到的做法是计算一家公司的总月份区间,例如1公司年分为2005/01-2013/12,总
区间极为9*12=108个月,因此新增一栏为1代表该公司是拥有九年完整资料,而2公司则是
2004/01-2008/12,共有60个月份,并增设为0,然後可利用if then delete的语法删除为
0的资料,但目前卡在前面的code不会写,希望各位大大能够提点小弟。
完成资料应该为下列情形,之後即可利用if then delete的做法删除2公司
公司 year month r
1 2005 01 1
1 2005 02 1
. . . 1
. . . 1
1 2008 01 1
. . . 1
1 2013 11 1
1 2013 12 1
2 2004 01 0
. . . 0
. . . 0
2 2005 01 0
. . . 0
2 2008 12 0
若提问不够详细,我会再加以补充,还望各位大大海含小弟第一次发文。
------------------------------------------------------------------------
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.115.87.220
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1428498844.A.FF8.html
1F:推 chien533: 用proc freq算每一家公司有几笔资料,结果用ods output 04/10 04:22
2F:→ chien533: 另存出来,然後用一个data step做一个dummy让frequency= 04/10 04:23
3F:→ chien533: 12的公司为1, 反之为0,最後把这比数据存回原始数据,用 04/10 04:24
4F:→ chien533: 一个if-then把dummy=0的删除即可。 04/10 04:25
5F:→ chien533: 厄...写完才发现你自己已经写了类似的方法...囧> 04/10 04:26