Question

我正在使用PSPP（不是SPSS，因为我无法在我的Ubuntu机器上运行）并且我的一组~100k记录与k-means集群聚集在一起。现在我真正需要的是比每个群集中有多少记录更详细的输出。我需要保存集群变量，即

第1行=＆gt;集群1

第2行=＆gt;集群4

第3行=＆gt;集群1

等...

基本上我需要额外的字段来保存每条记录的最终聚类亲和力。我目前的语法是：

QUICK CLUSTER  cat1 cat2 cat3 cat4 cat5 cat6 cat7 cat8 cat9 cat10 cat11 cat12
/CRITERIA=CLUSTERS(12) MXITER(100000000).

SPSS和PSPP共享大量相同的语法，因此如果SPSS中有选项，它也可以在这里工作。

Answer 1

统计信息应该在Ubuntu上运行，但Statistics QUICK CLUSTER命令有一个子命令

/ SAVE CLUSTER

应该做你想做的事。您可以选择在CLUSTER之后的括号中指定变量名称。

Answer 2

PSPP无法处理/ SAVE CLUSTER子命令。 试试吧！

QUICK CLUSTER var_list
      [/CRITERIA=CLUSTERS(k) [MXITER(max_iter)] CONVERGE(epsilon) [NOINITIAL]]
      [/MISSING={EXCLUDE,INCLUDE} {LISTWISE, PAIRWISE}]
      [/PRINT={INITIAL} {CLUSTER}]

见GNU page of PSPP

Answer 3

我知道您正在PSPP中寻找东西，但是最好的选择可能是将输出另存为一个开放文档，在电子表格中以.csv格式打开您的数据文件，然后将其复制到集群成员中（假设您在命令行中添加了/ print = cluster。

保存群集变量/可变PSPP

3 个答案: