我在使用KPrototyping聚类算法进行聚类时遇到错误,因为聚类类别数据和数值数据

时间:2019-04-13 07:21:01

标签: python cluster-analysis numeric categorical-data

因此,我正在使用KProtoypes聚类算法对包括分类列和数字列的混合变量进行聚类。 我收到一个错误:

  在'str'和'int'的实例之间不支持

'>'

而且所有功能都具有一致的数据类型。 我共享了一个代码片段,该片段与数据的屏幕截图一起运行。 我只想对这类数据进行聚类,任何有关聚类的建议都可以接受。

此外,我的数据如下: excel view of the data

关于数据的信息如下:Info of the data

这是我为k_prototype算法编写的代码:

  

kp = KPrototypes(n_clusters = 3,init ='random',verbose = True)
  kp.fit(X_dummy,categorical = [7,8,9,10,11,12,13])

还,请检查我在kp.fit中传递的分类列表

2 个答案:

答案 0 :(得分:0)

表中的L列包含字符串和数字(​​0)。

这可能是导致错误的原因。

答案 1 :(得分:0)

此消息表明,您尝试将字符串对象(str)与整数(int)进行比较。您需要在应用算法之前清除数据。 垃圾回收就是垃圾回收。