R read.spss错误导入SPSS .por文件 - “错误的字符及时”

时间:2013-12-20 06:24:20

标签: r

我正在尝试将NYPD stop-and-frisk数据导入R.数据位于http://www.nyc.gov/html/nypd/downloads/zip/analysis_and_planning/YYYY.zip的SPSS .por文件中 YYYY是2003年至2012年的一年

大多数文件加载正常,但2004,2007和2008文件都给我这个错误:

> library(foreign)
> mydata= read.spss("2004.por", to.data.frame=TRUE)
Error in read.spss("2004.por", to.data.frame = TRUE) : 
  error reading portable-file dictionary
In addition: Warning message:
In read.spss("2004.por", to.data.frame = TRUE) : Bad character in time
Execution halted

有关如何调试此问题的任何建议?我意识到read.spss不支持最新的SPSS版本,但鉴于大多数文件(10个中的7个)正确导入,我想知道它是否更微妙。

psppire加载所有文件而没有抱怨,但数据看起来已损坏,某些字段似乎与其他字段合并,而某些字段中的二进制数据。

1 个答案:

答案 0 :(得分:3)

我使用Read SPSS file into R中建议的memisc取得了一些成功。即,安装memisc后:

> install.packages('memisc')

您可以轻松阅读数据:

> library(memisc)
> data <- as.data.set(spss.portable.file('2004.por'))

虽然我没有彻底检查数据,但乍看之下似乎是正确的。