保存群集变量/可变PSPP

时间:2014-02-14 15:52:32

标签: cluster-analysis k-means spss statistics

我正在使用PSPP(不是SPSS,因为我无法在我的Ubuntu机器上运行)并且我的一组~100k记录与k-means集群聚集在一起。现在我真正需要的是比每个群集中有多少记录更详细的输出。我需要保存集群变量,即

第1行=>集群1

第2行=>集群4

第3行=>集群1

等...

基本上我需要额外的字段来保存每条记录的最终聚类亲和力。我目前的语法是:

QUICK CLUSTER  cat1 cat2 cat3 cat4 cat5 cat6 cat7 cat8 cat9 cat10 cat11 cat12
/CRITERIA=CLUSTERS(12) MXITER(100000000).

SPSS和PSPP共享大量相同的语法,因此如果SPSS中有选项,它也可以在这里工作。

3 个答案:

答案 0 :(得分:1)

统计信息应该在Ubuntu上运行,但Statistics QUICK CLUSTER命令有一个子命令

/ SAVE CLUSTER

应该做你想做的事。您可以选择在CLUSTER之后的括号中指定变量名称。

答案 1 :(得分:0)

PSPP无法处理/ SAVE CLUSTER子命令。 试试吧!

QUICK CLUSTER var_list
      [/CRITERIA=CLUSTERS(k) [MXITER(max_iter)] CONVERGE(epsilon) [NOINITIAL]]
      [/MISSING={EXCLUDE,INCLUDE} {LISTWISE, PAIRWISE}]
      [/PRINT={INITIAL} {CLUSTER}]

GNU page of PSPP

答案 2 :(得分:0)

我知道您正在PSPP中寻找东西,但是最好的选择可能是将输出另存为一个开放文档,在电子表格中以.csv格式打开您的数据文件,然后将其复制到集群成员中(假设您在命令行中添加了/ print = cluster。