应用错误收集

聚类二进制特征

时间：2020-04-09 13:46:52

标签： cluster-analysis binary-data survey

我有一个具有30多种二进制功能的数据框。每个要素代表一个调查中的问题，每行代表一个受访者（几乎有3000行）。

问题与受访者可能感兴趣的娱乐类型有关。0表示无兴趣，1表示兴趣。我想要一种将受访者归为喜欢类似娱乐类型的群体的方法。

我知道k均值不适用于二进制特征，但是我没有太多运气找到替代方法。谁能为我推荐一些东西？非常感谢！

0 个答案:

没有答案