在家庭调查的许多微观数据目录中(例如http://microdata.worldbank.org ...),数据字典(即代码簿)实际上是在.sps或.sas语法文本文件中描述的。结构清晰。这些脚本包括问题和范围之间的映射。原始数据集中的模态标签及其名称。
例如,请查看目录中任何打开记录中的任何第一个可下载的zip文件:
是否有一个已经可用的R函数可以解析.sps语法文件(优于.sas,因为问题标签在.sps中完全保留...),以便拥有一个允许的数据框轻松重新编码数据集?
我找到的最接近的是http://jason.bryer.org/posts/2013-01-10/Function_for_Reading_Codebooks_in_R.html,但它没有开箱即用.sps文件
此处还有一个旧的讨论:http://r.789695.n4.nabble.com/how-to-read-sps-SPSS-file-extension-td875309.html和Input data into R from .dat and .sps files,但没有提供解决方案......
提前致谢!