我目前正在使用从https://github.com/nicodv/kmodes获取的Kmodes库。 我的输入数据框具有分类属性,但它们是字符串格式...如下所示
但是当我运行kmodes并打印集群centriods时,它会返回一个如下所示的数组。
var
我不知道这些数字代表什么。我只假设列表中的四个元素意味着四个属性,但那么'4'是什么'位置'?我试图将这些数字与unique()的结果相匹配,但这似乎不对..
答案 0 :(得分:0)
这些数组中的nunber代表四个参数的模式:位置,季节,时间和天气。我假设你设置了5个集群。我建议您将数据集转换为类别的数字表示,而不是字符串。如果您混合使用数字数据和分类数据,我建议您使用k-prototype。