Question

我非常希望在不使用SAS IML的情况下了解我是否可以在SAS Base中处理这种情况;

我们说我有载体

            a    b     c     d    e        f
           1001 JPN 10,000  50%  JPN    2,000
           1001 EUR 12,648  100% EUR    3,000
           1001 USD 15,997  50%  USD    5,000
           1001 JPN 20,233  20%  JPN    8,000
           1001 EUR 25,591  20%  EUR    9,000
           1001 USD 32,368  50%  USD    4,000
           1002 JPN 28,393  50%  JPN    6,000
           1002 EUR 24,906  100% EUR    4,000
           1002 USD 21,847  50%  USD    8,000
           1002 TRY 19,164  20%  JPN    6,000
           1002 EUR 16,811  50%  EUR    15,000
           1002 USD 14,746  100% USD    52,000
           1003 USD 10,000  50%  XVN    8,000



 %macro;
 % let i = 1;
 data want;
 set have;
 %do %while a[&i]=a[eval(&i+1)] ;
 b = &i;
 &i=eval(&i+1);
 %end
 %mend

我想要做的是使用b = e来取max（c）和max（f）的差值，然后将这个差值乘以d，然后对每个不同的a乘以这些结果。这将是迭代的。我在这里写的表只是案例的一个小表示。

由于

Answer 1

这听起来像你的意思是这个短语＆＃34;对于a b = e＆＃34;是你想要处理BY A记录WHERE B = E 因此，在SAS中，如果要过滤要使用的记录，则可以使用WHERE语句或选项或IF语句。要处理具有相同值的一组变量的记录组，您将使用BY语句（或PROC SQL代码中的GROUP BY）。所以这是你的示例数据集。

data have ;
  length a 8 b $3 c d 8 e $3 f 8;
  informat c f comma32. d percent. ;
  input a b c d e f ;
cards;
1001 JPN 10,000  50%  JPN    2,000
1001 EUR 12,648  100% EUR    3,000
1001 USD 15,997  50%  USD    5,000
1001 JPN 20,233  20%  JPN    8,000
1001 EUR 25,591  20%  EUR    9,000
1001 USD 32,368  50%  USD    4,000
1002 JPN 28,393  50%  JPN    6,000
1002 EUR 24,906  100% EUR    4,000
1002 USD 21,847  50%  USD    8,000
1002 TRY 19,164  20%  JPN    6,000
1002 EUR 16,811  50%  EUR    15,000
1002 USD 14,746  100% USD    52,000
1003 USD 10,000  50%  XVN    8,000
run;

首先，您可以使用PROC SUMMARY找到C和F变量的最大值。

proc summary data=have nway ;
  by a ;
  where b=e ;
  var c f ;
  output out=summary max= / autoname ;
run;

然后您可以合并回详细记录以应用计算差异并乘以百分比。

data middle ;
  merge have summary ;
  by a ;
  if b=e ;
  diff = c_max - f_max ;
  product = diff * d ;
run;

然后，您可以再次使用PROC SUMMARY查找每个组中的总和。

proc summary data=middle nway ;
  by a ;
  var product ;
  output out=want sum=new_var ;
run;

总计

Obs      a     _TYPE_    _FREQ_     new_var
1     1001       0         6       67767.2
2     1002       0         5      -82624.5

Answer 2

感谢您的发帖！我假设你想要 b = e 时的最大值，但为了以防万一，我会给你两个可能的解决方案。请注意，您只需在任何SQL计算组中使用proc sql一次，但为了清楚起见，我们只需执行两次。

步骤1：获取 b 和 f 的最大值 b = e < /强>

proc sql noprint; create table maxes as select b, e, max(c) as max_c, max(f) as max_f from have where upcase(b) = upcase(e) group by b, e ; quit;

第2步：获取 b = e 的最大值到表中，通过 a 总结所有案例其中 b = e

proc sql noprint; create table want as select a, sum(result) as result /* Get max values into the table. Only interested in cases where a = b */ from(select st1.a, st1.b, st1.e, max_c, max_f, (max_c - max_f)*st1.d as result from have as st1 INNER JOIN maxes as st2 ON upcase(st1.b) = upcase(st2.b) AND upcase(st1.e) = upcase(st2.e) where upcase(st1.b) = upcase(st1.e) ) group by a ; quit;

现在，如果你想对 c 和 f 的最大表执行此操作，可以使用macro variables来执行此操作，表格按<分类em> a ，by-group processing和Sum Statement：

第1步：将 c 和 f 的最大值读入宏变量

proc sql noprint; select max(c), max(f) into :max_c, :max_f from have; quit;

第2步：汇总每个 a 的结果

data want; set have; by a; where upcase(b) = upcase(e); result+( (&max_c - &max_f)*d ); if(last.a) then do; output; call missing(result); *Reset the sum for the next a group; end; keep a result; run;

我希望这有帮助！这只是解决问题的一种方法，但还有很多其他方法。这一切都取决于你的目标，环境和编程风格。

Answer 3

因此，基本数据步骤或proc调用已经在输入数据上循环。如果您想使用数据集作为宏调用的参数值的源，那么您需要一个简单的驱动程序。

假设您已经定义了一个宏，它执行一系列复杂的数据步骤和proc步骤并获取一个或多个输入参数。然后，您可以创建参数值的数据集，并在简单的数据步骤中使用CALL EXECUTE生成对传递参数值的宏的调用。因此，如果宏％MYMACRO（）定义了5个位置参数，并且数据集HAVE有5个变量PARM1到PARM5和10个观测值，则此数据步骤将生成10个宏调用。

 data _null_;
    set have;
    call execute(cats('%nrstr(%mymacro)(',catx(',',of parm1-parm5),')'));
 run;

使用索引号的sas宏循环

3 个答案: