我想与R中的Health and Retirement Study合作。他们的网站提供“.da”文件和SAS提取程序。 SAS程序读取“.da”文件,如固定宽度文件:
libname EXTRACT 'c:\hrs1994\sas\' ;
DATA EXTRACT.W2H;
INFILE 'c:\hrs1994\data\W2H.DA' LRECL=358;
INPUT
HHID $ 1-6
PN $ 7-9
CSUBHH $ 10-10
ETC ETC
;
LABEL
HHID ="HOUSEHOLD IDENTIFIER"
PN ="PERSON NUMBER"
CSUBHH ="1994 SUB-HOUSEHOLD IDENTIFIER"
ASUBHH ="1992 SUB-HOUSEHOLD IDENTIFIER"
ETC ETC
;
1)这是什么类型的文件?我找不到有关此文件类型的任何信息。
2)是否有一种简单的方法可以将其读入R而无需从SAS导出.csv的中间步骤? read.fwf()
有没有办法在没有明确说明数百个变量名的情况下工作?
谢谢!
答案 0 :(得分:1)
经过一番研究后,您可以利用Stata字典文件* .DCT来检索数据文件* .DA的格式。为此,您需要下载"数据文件" .zip文件和" Stata数据描述符"来自HRS网站的.zip文件。只需记住处理文件时在每个数据文件上使用正确的字典文件。 IE,使用" W2FA.DCT"文件来定义" W2FA.DA"。
\S