管理大型SPSS(* .sav)文件(4.2 GB)

时间:2018-12-04 17:17:01

标签: csv spss pspp

我从另一家公司进行的调查中收到了一个SPSS文件,据称该文件仅包含1500名受访者,但是文件大小已经膨胀到4.2GB。我的直觉是,原因是该文件来自全球调查,而已选择的1500条记录仅来自美国,因此文件中包含一系列空白变量,这些变量的元数据以及可能也有多种语言/字母。

我只需要这些数据的一个子集,并且如果删除了元数据就可以使用它,但是我的问题是我无法打开该死的东西来减少变量的数量。我一直在使用这些工具来尝试以下变通办法,尽管我确信还有更好的选择:

  1. 使用PSPP(免费软件SPSS)打开文件-这将导致PSPP停止响应

  2. 使用R命令read.spss(来自外部软件包)编写一个.csv-这声称该文件具有重复的变量名,并且不会继续进行操作

  3. 使用R命令spsss.system.file编写一个.csv-当我尝试执行此操作时,R在尝试运行该命令时花了很多时间,并且已经运行了几个小时而没有明显变化成功。
  4. 使用PSPP文本转换工具(https://pspp.benpfaff.org/)创建字典或.csv文件-文件上传完成后,这两个选项都会崩溃。

我已经回到另一家公司尝试减少文件大小,但是我不确定是否有人有以下想法:

  • 使用其他程序/转换器打开文件,该程序可以将其转换为.csv或其他类似格式的文件格式
  • 使用其他程序至少只读取文件中包含的变量名,以便我可以向另一家公司提供所需的特定变量

1 个答案:

答案 0 :(得分:1)

PSPP中的以下命令应该可以满足您的需求:

$ pspp-convert originalFile.sav output.csv

如果没有,请提供终端错误消息。