以下是数据集的一部分:
Obs Buffer
...
75 14
76 13
77 64
78 38.1%
79 29.2%
80 69.2%
81 33
82 5-12
...
我只需要包含“%”的数据和前面两行。例如,在这种情况下,我想拉出“13”“64”“38.1%”“29.2%”和“69.2%”。
有没有办法实现这个目标?
答案 0 :(得分:1)
我喜欢使用point
来做这类事情。 _N_
作为行计数器是可靠的,只要你没有对数据步骤循环做任何有趣的事情。
data have;
length buffer $50;
input obs buffer $;
datalines;
75 14
76 13
77 64
78 38.1%
79 29.2%
80 69.2%
81 33
82 5-12
;;;;
run;
data want;
set have;
pointer=_N_;
if find(buffer,'%') then do;
output;
pointer=_N_-1;
set have point=pointer;
if not (find(buffer,'%')) then do;
output;
pointer=_N_-2;
set have point=pointer;
if not (find(buffer,'%')) then output;
end;
end;
run;
如果您需要恢复订单,您可以按pointer
之后排序(或obs
,如果这是一个真正的变量 - 我认为不是)。如果obs
确实是一个真正的变量(或者如果你用视图使它真实),那么在SQL中有一种有趣的方法可以做到这一点:
proc sql;
create table want as
select H.* from have H
left join have V on H.obs=V.obs-1
left join have A on H.obs=A.obs-2
where
(find(H.buffer,'%'))
or
(find(V.buffer,'%'))
or
(find(A.buffer,'%'))
order by H.obs
;
quit;
如何在没有数据传递的情况下使视频无效:
data have_vw/view=have_vw;
set have;
obs=_n_;
run;
然后在SQL查询中使用have_vw
而不是have
(在所有三个位置)。
答案 1 :(得分:0)
要回答您的问题:_N_
变量将返回数据步骤循环经过数据语句的次数。 (http://support.sas.com/documentation/cdl/en/lrcon/62955/HTML/default/viewer.htm#a000695104.htm)
但是,要解决您的问题,请使用lag()
(http://support.sas.com/documentation/cdl/en/lrdict/64316/HTML/default/viewer.htm#a000212547.htm)和包含声明,例如
data justBuffers;
set yourDS;
twoBefore = lag2(Buffer);
oneBefore = lag1(Buffer);
if Buffer ? '%' then do;
if not missing(twoBefore) then do;
x = twoBefore;
output;
end;
if not missing(oneBefore) then do;
x = oneBefore;
output;
end;
x = Buffer;
output;
call missing(oneBefore, twoBefore);
end;
keep x;
run;
我没有测试过代码,所以要小心!我相信你可以让它更顺畅。
答案 2 :(得分:0)
按照kungfujam的想法,我得到下面的代码并且它有效。
data adjust;
set source;
oneBefore = lag1(Buffer);
twoBefore = lag2(Buffer);
threeBefore = lag3(Buffer);
fourBefore = lag4(Buffer);
if index(buffer,'%')^=0 and index(onebefore,'%')^=0 and index(twobefore,'%')^=0then do;
x = fourBefore;
output;
x = threeBefore;
output;
x = twoBefore;
output;
x = oneBefore;
output;
x=buffer;
output;
end;
keep x;
run;