聚类二进制特征

时间:2020-04-09 13:46:52

标签: cluster-analysis binary-data survey

我有一个具有30多种二进制功能的数据框。每个要素代表一个调查中的问题,每行代表一个受访者(几乎有3000行)。

问题与受访者可能感兴趣的娱乐类型有关。0表示无兴趣,1表示兴趣。我想要一种将受访者归为喜欢类似娱乐类型的群体的方法。

我知道k均值不适用于二进制特征,但是我没有太多运气找到替代方法。谁能为我推荐一些东西?非常感谢!

0 个答案:

没有答案