我有一个PROC EXPORT问题,我想知道你是否可以回答。
我有一个包含800多个变量和超过200K观测值的SAS数据集,我试图将变量的子集导出到CSV文件(即我需要所有记录;我只是不想要所有800+变量)。我总是可以创建一个临时数据集“保持”我需要的字段并在该临时数据集上运行EXPORT,但我试图避免额外的步骤,因为我有大量的记录。
为了证明这一点,请考虑一个包含三个变量x,y和z的数据集。但是,我希望通过PROC EXPORT生成的文本文件只包含x和y。我尝试下面的解决方案并不是很有效。
SAS代码
当我运行以下代码时,我无法得到我需要的内容。如果您运行此代码并查看生成的文本文件,则每行的末尾都有一个逗号,并且标题包含数据集中的所有变量。另外,我在日志中收到一些我不应该收到的消息。
data ds1;
do x = 1 to 100;
y = x * x;
z = x * x * x;
output;
end;
run;
proc export data=ds1(keep=x y)
file='c:\test.csv'
dbms=csv
replace;
quit;
以下是生成的文本文件的前几行(“C:\ test.csv”)
x,y,z
1,1,
2,4,
3,9,
4,16,
SAS日志
9343 proc export data=ds1(keep=x y)
9344 file='c:\test.csv'
9345 dbms=csv
9346 replace;
9347 quit;
9348 /**********************************************************************
9349 * PRODUCT: SAS
9350 * VERSION: 9.2
9351 * CREATOR: External File Interface
9352 * DATE: 30JUL12
9353 * DESC: Generated SAS Datastep Code
9354 * TEMPLATE SOURCE: (None Specified.)
9355 ***********************************************************************/
9356 data _null_;
9357 %let _EFIERR_ = 0; /* set the ERROR detection macro variable */
9358 %let _EFIREC_ = 0; /* clear export record count macro variable */
9359 file 'c:\test.csv' delimiter=',' DSD DROPOVER lrecl=32767;
9360 if _n_ = 1 then /* write column names or labels */
9361 do;
9362 put
9363 "x"
9364 ','
9365 "y"
9366 ','
9367 "z"
9368 ;
9369 end;
9370 set DS1(keep=x y) end=EFIEOD;
9371 format x best12. ;
9372 format y best12. ;
9373 format z best12. ;
9374 do;
9375 EFIOUT + 1;
9376 put x @;
9377 put y @;
9378 put z ;
9379 ;
9380 end;
9381 if _ERROR_ then call symputx('_EFIERR_',1); /* set ERROR detection macro variable */
9382 if EFIEOD then call symputx('_EFIREC_',EFIOUT);
9383 run;
NOTE: Variable z is uninitialized.
NOTE: The file 'c:\test.csv' is:
Filename=c:\test.csv,
RECFM=V,LRECL=32767,File Size (bytes)=0,
Last Modified=30Jul2012:12:05:02,
Create Time=30Jul2012:12:05:02
NOTE: 101 records were written to the file 'c:\test.csv'.
The minimum record length was 4.
The maximum record length was 10.
NOTE: There were 100 observations read from the data set WORK.DS1.
NOTE: DATA statement used (Total process time):
real time 0.04 seconds
cpu time 0.01 seconds
100 records created in c:\test.csv from DS1.
NOTE: "c:\test.csv" file was successfully created.
NOTE: PROCEDURE EXPORT used (Total process time):
real time 0.12 seconds
cpu time 0.06 seconds
我有什么想法可以解决这个问题?我在Windows 7上运行SAS 9.2。
任何帮助将不胜感激。谢谢。
答案 0 :(得分:7)
基于Itzy对我的问题的评论,这里是答案,这正是我所需要的。
proc sql;
create view vw_ds1 as
select x, y from ds1;
quit;
proc export data=vw_ds1
file='c:\test.csv'
dbms=csv
replace;
quit;
感谢您的帮助!