快速计算许多变量中缺失值的方法

时间:2018-08-22 14:07:55

标签: python spss

我创建了一个小程序来计算“无”的数量,因此缺少值。但这是一个非常耗时的问题(y变量在y = cal左右,而且这太多了,因为我正在处理更大的数据集)。

所以我正在寻找替代方法,也许有人可以在这里提供帮助。这是我的程序:

6-7mn

我也尝试替换:

1000

作者

BEGIN PROGRAM.
import spss
vars=spss.GetVariableCount()

for i in range(vars):
    dataCursor=spss.Cursor([i])
    oneVar=dataCursor.fetchall()
    dataCursor.close()
    miss=str(oneVar)
    counter=miss.count('None')
    #print counter
print "done"
END PROGRAM.

但是这并没有改变任何东西。有人可以在这里帮助我吗?我在Google帮助下看到了该程序:

counter=miss.count('None')

但是我无法使其针对所有变量运行。因为当我们有一个counter=miss.find('None') 时,它将始终列在该列表的第一位置,所以我认为找到解决方案可能会有所帮助。

如果有人有任何想法,我将非常感谢!

1 个答案:

答案 0 :(得分:0)

SPSS语法aggregate命令可以轻松做到这一点:

aggregate ...... /nms1 to nms1000=nmiss(var1 to var1000).