我有如下数据。
我需要向每个人展示在特定年份居住多少天。
ı在宏中尝试了很多do循环和if语句。
ı工作很多,但我不能这样做,我的手空了,我的心碎了。
*name STARTDATE ENDDATE
*AAA 17.10.2012 21.11.2013
*BBB 10.05.2014 15.09.2015
*CCC 06.04.2010 05.05.2013
*DDD 07.02.2011 07.02.2013
*EEE 30.03.2013 30.01.2014
*FFF 01.01.2010 06.05.2010
因此我需要这个
*name STARTDATE ENDDATE DayIn2010 DayIn2011 DayIn2012 DayIn2013 DayIn2014 DayIn2015
*AAA 17.10.2012 21.11.2013 0 0 75 325 0 0
*BBB 10.05.2014 15.09.2015 0 0 0 0 235 258
*CCC 06.04.2010 05.05.2013 269 365 365 125 0 0
*DDD 07.02.2011 07.02.2013 0 327 365 38 0 0
*EEE 30.03.2013 30.01.2014 0 0 0 276 30 0
*FFF 01.01.2010 06.05.2010 125 0 0 0 0 0
你可以帮我吗?
答案 0 :(得分:1)
这是你可以做到这一点的一种方式。不需要宏,只需要数据步骤循环:
data have;
input name $3. (STARTDATE ENDDATE) (+1 ddmmyy10.);
format STARTDATE ENDDATE ddmmyy10.;
cards;
AAA 17.10.2012 21.11.2013
BBB 10.05.2014 15.09.2015
CCC 06.04.2010 05.05.2013
DDD 07.02.2011 07.02.2013
EEE 30.03.2013 30.01.2014
FFF 01.01.2010 06.05.2010
;
run;
data want;
set have;
format YEAR_START YEAR_END ddmmyy10.;
do YEAR = 2010 to 2015;
YEAR_START = mdy(1,1,YEAR);
YEAR_END = mdy(12,31,YEAR);
DAYS_ALIVE = max(0,min(ENDDATE, YEAR_END) - max(STARTDATE,YEAR_START) + 1);
output;
end;
run;
您需要事先知道数据集中的最小和最大年份值,以便您可以编写正确的do循环。如果你没有,那么你可以写另一段代码来做到这一点。
答案 1 :(得分:1)
这是另一种选择,您可能不需要提前了解开始/结束年份。
data have;
input name $3. (STARTDATE ENDDATE) (+1 ddmmyy10.);
format STARTDATE ENDDATE ddmmyy10.;
cards;
AAA 17.10.2012 21.11.2013
BBB 10.05.2014 15.09.2015
CCC 06.04.2010 05.05.2013
DDD 07.02.2011 07.02.2013
EEE 30.03.2013 30.01.2014
FFF 01.01.2010 06.05.2010
;
run;
data s1;
set have;
do dt=startdate to enddate;
output;
end;
run;
ods output CrossTabFreqs=s2 (where=(not missing(dt) and not missing(name)) keep=name dt frequency );
proc freq data=s1;
tables name*dt /
NOROW
NOCOL
NOPERCENT
NOCUM;
format dt year4.;
run;
proc sort data=s2;
by name;
run;
PROC TRANSPOSE DATA=s2
OUT=want(drop=_name_ _label_)
PREFIX=DaysIn
;
BY name;
ID dt;
VAR Frequency;
RUN; QUIT