我非常希望在不使用SAS IML的情况下了解我是否可以在SAS Base中处理这种情况;
我们说我有载体
a b c d e f
1001 JPN 10,000 50% JPN 2,000
1001 EUR 12,648 100% EUR 3,000
1001 USD 15,997 50% USD 5,000
1001 JPN 20,233 20% JPN 8,000
1001 EUR 25,591 20% EUR 9,000
1001 USD 32,368 50% USD 4,000
1002 JPN 28,393 50% JPN 6,000
1002 EUR 24,906 100% EUR 4,000
1002 USD 21,847 50% USD 8,000
1002 TRY 19,164 20% JPN 6,000
1002 EUR 16,811 50% EUR 15,000
1002 USD 14,746 100% USD 52,000
1003 USD 10,000 50% XVN 8,000
%macro;
% let i = 1;
data want;
set have;
%do %while a[&i]=a[eval(&i+1)] ;
b = &i;
&i=eval(&i+1);
%end
%mend
我想要做的是使用b = e来取max(c)和max(f)的差值,然后将这个差值乘以d,然后对每个不同的a乘以这些结果。这将是迭代的。我在这里写的表只是案例的一个小表示。
由于
答案 0 :(得分:1)
这听起来像你的意思是这个短语"对于a b = e"是你想要处理BY A记录WHERE B = E 因此,在SAS中,如果要过滤要使用的记录,则可以使用WHERE语句或选项或IF语句。要处理具有相同值的一组变量的记录组,您将使用BY语句(或PROC SQL代码中的GROUP BY)。所以这是你的示例数据集。
data have ;
length a 8 b $3 c d 8 e $3 f 8;
informat c f comma32. d percent. ;
input a b c d e f ;
cards;
1001 JPN 10,000 50% JPN 2,000
1001 EUR 12,648 100% EUR 3,000
1001 USD 15,997 50% USD 5,000
1001 JPN 20,233 20% JPN 8,000
1001 EUR 25,591 20% EUR 9,000
1001 USD 32,368 50% USD 4,000
1002 JPN 28,393 50% JPN 6,000
1002 EUR 24,906 100% EUR 4,000
1002 USD 21,847 50% USD 8,000
1002 TRY 19,164 20% JPN 6,000
1002 EUR 16,811 50% EUR 15,000
1002 USD 14,746 100% USD 52,000
1003 USD 10,000 50% XVN 8,000
run;
首先,您可以使用PROC SUMMARY找到C和F变量的最大值。
proc summary data=have nway ;
by a ;
where b=e ;
var c f ;
output out=summary max= / autoname ;
run;
然后您可以合并回详细记录以应用计算差异并乘以百分比。
data middle ;
merge have summary ;
by a ;
if b=e ;
diff = c_max - f_max ;
product = diff * d ;
run;
然后,您可以再次使用PROC SUMMARY查找每个组中的总和。
proc summary data=middle nway ;
by a ;
var product ;
output out=want sum=new_var ;
run;
总计
Obs a _TYPE_ _FREQ_ new_var
1 1001 0 6 67767.2
2 1002 0 5 -82624.5
答案 1 :(得分:1)
感谢您的发帖!我假设你想要 b = e 时的最大值,但为了以防万一,我会给你两个可能的解决方案。请注意,您只需在任何SQL计算组中使用proc sql
一次,但为了清楚起见,我们只需执行两次。
步骤1:获取 b 和 f 的最大值 b = e < /强>
proc sql noprint;
create table maxes as
select b, e,
max(c) as max_c, max(f) as max_f
from have
where upcase(b) = upcase(e)
group by b, e
;
quit;
第2步:获取 b = e 的最大值到表中,通过 a 总结所有案例其中 b = e
proc sql noprint;
create table want as
select a, sum(result) as result
/* Get max values into the table.
Only interested in cases where a = b */
from(select st1.a, st1.b, st1.e,
max_c, max_f,
(max_c - max_f)*st1.d as result
from have as st1
INNER JOIN
maxes as st2
ON upcase(st1.b) = upcase(st2.b)
AND upcase(st1.e) = upcase(st2.e)
where upcase(st1.b) = upcase(st1.e) )
group by a
;
quit;
现在,如果你想对 c 和 f 的最大表执行此操作,可以使用macro variables来执行此操作,表格按<分类em> a ,by-group processing和Sum Statement:
第1步:将 c 和 f 的最大值读入宏变量
proc sql noprint;
select max(c), max(f)
into :max_c, :max_f
from have;
quit;
第2步:汇总每个 a 的结果
data want;
set have;
by a;
where upcase(b) = upcase(e);
result+( (&max_c - &max_f)*d );
if(last.a) then do;
output;
call missing(result); *Reset the sum for the next a group;
end;
keep a result;
run;
我希望这有帮助!这只是解决问题的一种方法,但还有很多其他方法。这一切都取决于你的目标,环境和编程风格。
答案 2 :(得分:0)
因此,基本数据步骤或proc调用已经在输入数据上循环。 如果您想使用数据集作为宏调用的参数值的源,那么您需要一个简单的驱动程序。
假设您已经定义了一个宏,它执行一系列复杂的数据步骤和proc步骤并获取一个或多个输入参数。然后,您可以创建参数值的数据集,并在简单的数据步骤中使用CALL EXECUTE生成对传递参数值的宏的调用。因此,如果宏%MYMACRO()定义了5个位置参数,并且数据集HAVE有5个变量PARM1到PARM5和10个观测值,则此数据步骤将生成10个宏调用。
data _null_;
set have;
call execute(cats('%nrstr(%mymacro)(',catx(',',of parm1-parm5),')'));
run;