我正在尝试转换如下数据集:
A B C
2011 NH 25
2011 MA 40
2015 CA 50
2016 KY 58
我希望输出为:
B 2011 2015 2016
NH 25 - -
MA 40 - -
CA - 50 -
KY - - 58
当前我的代码是:
proc transpose data = Test out = Test2(drop = _label_);
id Year_Enter;
Var Numeric;
by Category NOTSORTED;
run;
但是,当我运行此命令时,我所有的列名前面都带有下划线,例如_2011,_2015,_2016。
如何防止添加下划线?
谢谢!
答案 0 :(得分:1)
如果需要数据集,则可以为变量使用有效的名称。变量名通常不能以数字开头。您可以在PROC TRANSPOSE语句上使用PREFIX =选项来选择为数字变量值加上前缀的字符,以生成有效名称。因此,您可以使用query->getBindings()
生成类似PREFIX=Y
的变量名称,也可以使用Y2011
生成类似PREFIX=Year_
的名称。您可以使用Year_2011
语句将数字字符串作为变量的标签。
IDLABEL
proc transpose data=have prefix=Year_ out=want(drop=_name_);
by State;
id Year;
idlabel Year;
var Value;
format year 4.;
run;
proc print;
run;
但实际上您似乎想生成一个REPORT而不是一个DATASET。例如,您可以使用PROC REPORT从原始数据集中创建该报告,而无需PROC TRANSPOSE。
proc print label;
run;
答案 1 :(得分:0)
您需要启用扩展变量名。 SAS变量必须遵循某些naming conventions,其中一些可以被覆盖:
- 名称的最大长度为32个字节。
- 名称可以包含拉丁字母,数字或下划线。
- 名称中不能包含空格或特殊字符,下划线除外。
- 名称必须以拉丁字母(AZ,az)或下划线开头。
如果启用选项options validvarname=any;
,则将删除数字变量名称前面的下划线,并使用扩展的SAS命名规则。请参见下面的示例。
data have;
input A B$ C;
datalines;
2011 NH 25
2011 MA 40
2015 CA 50
2016 KY 58
;
run;
options validvarname=any;
proc transpose data = have out = want(drop = _label_);
id A;
Var C;
by B NOTSORTED;
run;
答案 2 :(得分:0)