使用转义双引号导入RFC 4180 CSV文件的SPSS语法

时间:2014-08-05 15:03:15

标签: csv import spss rfc4180

如何将RFC4180标准CSV文件读入SPSS?具体来说,如何处理嵌入了双引号的字符串值,这些双引号被(正确)转义为第二个双引号?

以下是具有问题值的记录的一个实例:

2985909844,,3,3,3,3,3,3,1,2,2,"I recall an ad for ""RackSpace"", but I don't recall if this was here or in another page.",200,1,1,1,0,1,0,Often

我使用的SPSS语法如下:

GET DATA
  /TYPE=TXT
  /FILE="/Users/pieter/Work/Stackoverflow/2013_StackOverflowRecoded.csv"
  /IMPORTCASE=ALL
  /ARRANGEMENT=DELIMITED
  /DELCASE=LINE
  /FIRSTCASE=2
  /DELIMITERS=","
  /QUALIFIER='"'
  /VARIABLES=  ... list of column names...

导入成功,但在遇到此类值后会偏离轨道并发出警告。

2 个答案:

答案 0 :(得分:2)

我担心这是SPSS中的一个错误,因此无法解决。

如果您觉得有用,可能需要向IBM支持团队询问此问题并在此处发布答案。

一种解决方法是将* .csv文件中的转义双引号更改为其他引用类型。如果您使用高级文本编辑器(例如notepad ++或" sed" UNIX上的命令行工具,如操作系统。

答案 1 :(得分:1)

尝试当前版本的Statistics(22)中的示例可以正确处理双重标识符,但是,如果使用文本向导生成语法,则生成的语法中的字段太短,因此您需要增加宽度。