需要使用sas重复从多个文件读取数据,并在从单独文件创建的单独数据集上运行freq

时间:2013-02-18 18:04:54

标签: sas

我是SAS新手,在创建以下程序时遇到的困难很少。

我的要求是传递动态生成的文件名并读取它,这样就不必编写代码五次来读取5个不同文件中的数据,然后在数据集上运行freqs。

我提供了以下代码,必须为50多个文件编写此代码:

代码

filename inp1 '/chshttp/prod/clients/coms/raw/coms_coms_relg_f1102_t1102_c10216_vEL5535.raw';
filename inp2 '/chshttp/prod/clients/coms/raw/coms_coms_relg_f1103_t1103_c10317_vEL8312.raw';
filename inp3 '/chshttp/prod/clients/coms/raw/coms_coms_relg_f1104_t1104_c10420_vEL11614.raw';
filename inp4 '/chshttp/prod/clients/coms/raw/coms_coms_relg_f1105_t1105_c10510_vEL13913.raw';
filename inp5 '/chshttp/prod/clients/coms/raw/coms_coms_relg_f1106_t1106_c10628_vEL17663.raw';

data test;

Do i = 1 to 5;

infile_name = 'inp' || i;

infile infile_name recfm = v lrecl=1800 end=eof truncover;

        INPUT 
                @1      E_CUSTDEF1_CLIENT_ID                          $CHAR5.
                @1235   E_MED_PLAN_CODE                               $CHAR20.
                @1090   MED_INS_ELIG_COVERAGE_IND                     $CHAR20.
                @1064   MED_COVERAGE_BEGIN_DATE                       $CHAR8.
                @1072   MED_COVERAGE_TERM_DATE                        $CHAR8.
                ;

                if E_CUSTDEF1_CLIENT_ID ='00002' then 

                output test;
end;
run;

proc freq data = test;
tables E_CUSTDEF1_CLIENT_ID*E_MED_PLAN_CODE / list missing;

run;

请帮助!!

2 个答案:

答案 0 :(得分:0)

这是一个你可以适应的例子。有不同的方法可以做到这一点,但这是一个 - 取决于你不想要的频率。

步骤1:创建一个数据集' my_filenames',它将您要读取的文件名(每行一个)存储在变量FILE_NAME中。

第2步:读入文件。

data my_data;
set my_filenames;
infile a filevar=file_name <the rest of your options>;
<your input statement>;
run;

proc freq data=mydata;
by file_name;
<your table statements>;
run;

这是一个简单的数据驱动代码,它不需要宏或将大量数据存储在不应该包含数据的内容中(宏变量,文件名等)

答案 1 :(得分:0)

要直接回答您的问题,这里有一个SAS宏来读取每个文件并运行PROC FREQ

%macro freqme(dsn);

data test;
   infile "&dsn" recfm = v lrecl=1800 end=eof truncover;

   INPUT  @1   E_CUSTDEF1_CLIENT_ID        $CHAR5.
         @1235   E_MED_PLAN_CODE             $CHAR20.
         @1090   MED_INS_ELIG_COVERAGE_IND   $CHAR20.
         @1064   MED_COVERAGE_BEGIN_DATE     $CHAR8.
         @1072   MED_COVERAGE_TERM_DATE      $CHAR8.
         ;

   if E_CUSTDEF1_CLIENT_ID = '00002';
run;

proc freq data=test;
   tables E_CUSTDEF1_CLIENT_ID*E_MED_PLAN_CODE / list missing;
run;
proc delete data=test;
run;
%mend;

%freqme(/chshttp/prod/clients/coms/raw/coms_coms_relg_f1102_t1102_c10216_vEL5535.raw);
%freqme(/chshttp/prod/clients/coms/raw/coms_coms_relg_f1103_t1103_c10317_vEL8312.raw);
%freqme(/chshttp/prod/clients/coms/raw/coms_coms_relg_f1104_t1104_c10420_vEL11614.raw);
%freqme(/chshttp/prod/clients/coms/raw/coms_coms_relg_f1105_t1105_c10510_vEL13913.raw);
%freqme(/chshttp/prod/clients/coms/raw/coms_coms_relg_f1106_t1106_c10628_vEL17663.raw);

请注意,我在创建报告后添加了PROC DELETE步骤来删除SAS数据集。我做了更多的说明,因为你没有说你需要将文件作为SAS数据集进行后续处理。

您可以将其用作其他宏编程的模板。