我正在使用PSPP(不是SPSS,因为我无法在我的Ubuntu机器上运行)并且我的一组~100k记录与k-means集群聚集在一起。现在我真正需要的是比每个群集中有多少记录更详细的输出。我需要保存集群变量,即
第1行=>集群1
第2行=>集群4
第3行=>集群1
等...
基本上我需要额外的字段来保存每条记录的最终聚类亲和力。我目前的语法是:
QUICK CLUSTER cat1 cat2 cat3 cat4 cat5 cat6 cat7 cat8 cat9 cat10 cat11 cat12
/CRITERIA=CLUSTERS(12) MXITER(100000000).
SPSS和PSPP共享大量相同的语法,因此如果SPSS中有选项,它也可以在这里工作。
答案 0 :(得分:1)
统计信息应该在Ubuntu上运行,但Statistics QUICK CLUSTER命令有一个子命令
/ SAVE CLUSTER
应该做你想做的事。您可以选择在CLUSTER之后的括号中指定变量名称。
答案 1 :(得分:0)
PSPP
无法处理/ SAVE CLUSTER子命令。 试试吧!
QUICK CLUSTER var_list
[/CRITERIA=CLUSTERS(k) [MXITER(max_iter)] CONVERGE(epsilon) [NOINITIAL]]
[/MISSING={EXCLUDE,INCLUDE} {LISTWISE, PAIRWISE}]
[/PRINT={INITIAL} {CLUSTER}]
答案 2 :(得分:0)
我知道您正在PSPP中寻找东西,但是最好的选择可能是将输出另存为一个开放文档,在电子表格中以.csv格式打开您的数据文件,然后将其复制到集群成员中(假设您在命令行中添加了/ print = cluster。