使用Proc Transpose时如何防止变量名前导下划线

时间:2019-03-04 18:59:30

标签: sas transpose proc

我正在尝试转换如下数据集:

  A        B        C
2011      NH        25
2011      MA        40 
2015      CA        50
2016      KY        58

我希望输出为:

 B     2011     2015      2016
NH      25        -         -
MA      40        -         -
CA       -        50        -
KY       -        -         58

当前我的代码是:

 proc transpose data = Test out = Test2(drop = _label_);
     id Year_Enter;
     Var Numeric;
     by Category NOTSORTED;
 run;

但是,当我运行此命令时,我所有的列名前面都带有下划线,例如_2011,_2015,_2016。

如何防止添加下划线?

谢谢!

3 个答案:

答案 0 :(得分:1)

如果需要数据集,则可以为变量使用有效的名称。变量名通常不能以数字开头。您可以在PROC TRANSPOSE语句上使用PREFIX =选项来选择为数字变量值加上前缀的字符,以生成有效名称。因此,您可以使用query->getBindings()生成类似PREFIX=Y的变量名称,也可以使用Y2011生成类似PREFIX=Year_的名称。您可以使用Year_2011语句将数字字符串作为变量的标签。

IDLABEL

enter image description here

proc transpose data=have prefix=Year_ out=want(drop=_name_);
  by State;
  id Year;
  idlabel Year;
  var Value;
  format year 4.;
run;

proc print;
run;

enter image description here

但实际上您似乎想生成一个REPORT而不是一个DATASET。例如,您可以使用PROC REPORT从原始数据集中创建该报告,而无需PROC TRANSPOSE。

proc print label;
run;

enter image description here

答案 1 :(得分:0)

您需要启用扩展变量名。 SAS变量必须遵循某些naming conventions,其中一些可以被覆盖:

  
      
  • 名称的最大长度为32个字节。
  •   
  • 名称可以包含拉丁字母,数字或下划线。
  •   
  • 名称中不能包含空格或特殊字符,下划线除外。
  •   
  • 名称必须以拉丁字母(AZ,az)或下划线开头。
  •   

如果启用选项options validvarname=any;,则将删除数字变量名称前面的下划线,并使用扩展的SAS命名规则。请参见下面的示例。

data have;
    input A B$ C;
    datalines;
2011 NH 25
2011 MA 40
2015 CA 50
2016 KY 58
;
run;

options validvarname=any;
proc transpose data = have out = want(drop = _label_);
     id A;
     Var C;
     by B NOTSORTED;
run;

答案 2 :(得分:0)

转换为某种形式以使数据值(年)成为元数据(以年作为列名)通常表示报告转换。考虑使用Proc TABULATE来呈现转换。

data have; input
A        B $       C; datalines;
2011      NH        25
2011      MA        40 
2015      CA        50
2016      KY        58
run;

proc tabulate data=have;
  class a;
  class b / order=data;
  var c;
  table b='',a=''*c=''*sum='';
run;

enter image description here