如何将RFC4180标准CSV文件读入SPSS?具体来说,如何处理嵌入了双引号的字符串值,这些双引号被(正确)转义为第二个双引号?
以下是具有问题值的记录的一个实例:
2985909844,,3,3,3,3,3,3,1,2,2,"I recall an ad for ""RackSpace"", but I don't recall if this was here or in another page.",200,1,1,1,0,1,0,Often
我使用的SPSS语法如下:
GET DATA
/TYPE=TXT
/FILE="/Users/pieter/Work/Stackoverflow/2013_StackOverflowRecoded.csv"
/IMPORTCASE=ALL
/ARRANGEMENT=DELIMITED
/DELCASE=LINE
/FIRSTCASE=2
/DELIMITERS=","
/QUALIFIER='"'
/VARIABLES= ... list of column names...
导入成功,但在遇到此类值后会偏离轨道并发出警告。
答案 0 :(得分:2)
我担心这是SPSS中的一个错误,因此无法解决。
如果您觉得有用,可能需要向IBM支持团队询问此问题并在此处发布答案。
一种解决方法是将* .csv文件中的转义双引号更改为其他引用类型。如果您使用高级文本编辑器(例如notepad ++或" sed" UNIX上的命令行工具,如操作系统。
答案 1 :(得分:1)
尝试当前版本的Statistics(22)中的示例可以正确处理双重标识符,但是,如果使用文本向导生成语法,则生成的语法中的字段太短,因此您需要增加宽度。