SAS加载文件txt

时间:2012-12-17 17:10:00

标签: sas

你能帮帮我吗?

我有一个txt文件:

1 1 8 2 004 149 44.9 Brabant
14 7 7 9 9
32 10 13.5 165 20 7 21 19.9 7
1 1 9 2 004 133 32.5 Liege
12 7 6 11 8
14 18 20.9 140 22.9 18 15 4.4 5

在前三行中分析了相同的ID,分析的变量是:

anne, sex, nat, age, prov, tai, pds, ptr, pbi, pss, psi, pmo, dyn, efl, fp, 
slo, cna, flt, rsa, sbf, ll.

如何在SAS中加载文件并提供行和列的名称?

非常非常抱歉! ELISA

3 个答案:

答案 0 :(得分:1)

听起来你的输入文件有三行数据用于一次观察;我按照我的意图重新格式化了您原来的问题。

如果这是真的,您只需要在一个INPUT语句中读取所有三行,使用/运算符跳到下一行。换句话说,试试这个:

data STAT2012.data2004; 
    infile 'C:\Users\acer\STAT2012\data2004.txt';
    input ID
          anne sex nat $ age prov tai pds $ 
        / ptr pbi pss psi pmo 
        / dyn efl fp slo cna flt rsa sbf ll;
run;

当然,您应该确定变量名称与您的文件匹配,并且结果是您所需要的。我给你一个非常基本的例子,只是为了让你开始。

更新:我的示例基于您发布的示例数据。我假设第一列是ID变量,因为否则您的样本数据的值比您的示例更多。

在您的情况下,最好的方法是使用INFORMAT语句来定义应该如何读取每个变量。这将要求您了解每个变量的类型(字符或数字)以及每个字符变量的最大长度。对于数字变量,您只需使用best32.信息。如果你真的不知道字符变量的最大长度,你可以尝试使用$200.,这将使每个变量长200个字符。

例如:

data STAT2012.data2004; 
    infile 'C:\Users\acer\STAT2012\data2004.txt';

    /* Define the variables that will be read */
    informat 
    /* First line, 8 variables */
          anne  best32.
          sex   $1.
          nat   $4.
          age   best32.
          prov  best32.
          tai   best32.
          pds   best32.   
          ptr   $200.  /* 8th field in your sample, apparently character */

    /* Second line, 5 variables */
          pbi   best32.
          pss   best32.
          psi   best32.
          pmo   best32.
          dyn   best32.

    /* Third line, 9 variables */
          efl   best32.
          fp    best32.
          slo   best32.
          cna   best32.
          flt   best32.
          rsa   best32.
          sbf   best32.
          ll    best32.
         unkn   best32.;  /* an unknown variable I invented */

    /* Input the variables in the order they appear in the file.*/
    input anne sex nat age prov tai pds pdr 
        / pbi pss psi pmo dyn 
        / efl fp slo cna flt rsa sbf ll unkn;
run;

请注意,INFILE声明中不需要DLM选项。另请注意,此示例不会读取您提供的示例数据中的所有数据;我发明了一个新的变量。

要记住的重要事项是按源文件中显示的顺序读取变量。

答案 1 :(得分:0)

data STAT2012.data2004; 
    infile 'C:\Users\acer\STAT2012\data2004.txt' dlm=' ';
    input 
          anne 1-4  sex $6   nat $8  age 10 prov @$11-21 tai @23  pds @25
        / ptr 1-2 pbi 4 pss 6 psi 8 pmo 10
        /dyn 1-2 efl 4-5 fp 7-10 slo 12-14 cna 16-17 flt 19 rsa 21-22 sbf 24-27 ll 29;
run;

答案 2 :(得分:0)

我猜这个问题可能不仅仅是位置名称中的单词。您可以通过以下方式克服它(假设最长名称少于200个字符):

data data2004; 
  infile 'C:\Users\acer\STAT2012\data2004.txt' truncover;
  input ID
    anne sex nat $ age prov tai pds $200.;
  input ptr pbi pss psi pmo ;
  input dyn efl fp slo cna flt rsa sbf ll;
run;