你好我在尝试与KPrototypes集群时遇到了一些麻烦。我的数据集具有以下结构;
0 1 2 3 4 5
1 0.3 1.2 2.2 4.4 4.4
2 1.2 1.4 1.5 2.5 4.1
3 1 0 1 0 1
4 0 1 0 1 0
我的代码如下;
from kmodes.kprototypes import KPrototypes
test=KPrototypes(n_clusters=2, init='Huang')
cluster=test.fit_predict(X, categorical=[3,4])
我的问题是我似乎无法在代码中定义分类虚拟变量。 Categorical = [3,4]指的是第三个amd第四列而不是row。
有人建议如何定义行而不是列?
答案 0 :(得分:1)
KPrototypes期望列作为变量。您可以转置X但请注意列索引从零开始,因此对于上面的示例,您将拥有:
cluster=test.fit_predict(X.T, categorical=[2,3])