应用错误收集

时间：2012-08-21 20:13:45

标签： cluster-analysis spss

我的研究问题是关于老年人，我必须找出潜在的群体。数据来自问卷。我已经考虑了聚类分析，但问题是我想要检测感知的健康状况以及哪些因素会影响感知的健康状况，例如：什么样的老年人群体将他们的健康列为坏人。

我想在分析中查看30个问题，看看寡妇的健康状况是否比平均水平更好或更差。我的数据也有权重，所以我需要使用复杂的样本。

如何使用现有功能，或者我应该使用哪种分析？

答案 0 :(得分：0)

首先要解决的关键挑战是指定相似性度量。一旦您可以测量相似性，就可以使用各种聚类算法。

但问卷调查数据并没有很好的向量空间，所以你不能只使用欧几里德距离。

答案 1 :(得分：0)

如果要使用SPSS生成群集，标准选项包括：k-means，层次聚类分析或2步。我有一些普通notes on cluster analysis in SPSS here。见幻灯片34。

如果你想看看寡妇的健康状况是否不同，那么你需要形成一个健康指标，并比较寡妇和非寡妇之间的衡量标准（可能是在组间t检验）。如果您有30个与健康相关的问题，那么您可能需要进行因子分析，以了解这些项目如何组合在一起。

如果您正在尝试开发一种预测感知健康的一般模型，那么可以使用各种建模选项。多元回归将是一个明显的起点。如果您有许多潜在的预测因子，那么您有很多选择，无论您是要测试特定模型还是采用更多数据驱动的模型构建方法。

更一般地说，听起来您需要澄清分析的目的以及您想要测试的特定假设。