标签: cluster-analysis binary-data survey
我有一个具有30多种二进制功能的数据框。每个要素代表一个调查中的问题,每行代表一个受访者(几乎有3000行)。
问题与受访者可能感兴趣的娱乐类型有关。0表示无兴趣,1表示兴趣。我想要一种将受访者归为喜欢类似娱乐类型的群体的方法。
我知道k均值不适用于二进制特征,但是我没有太多运气找到替代方法。谁能为我推荐一些东西?非常感谢!