我使用hclust
函数在数据框中聚类基于文本的字段。为此我必须做一些文本清理,因此我提取文本数据以使用tm_map
函数。之后我应用了一个聚类算法。
群集工作正常,但我不知道如何将原始数据框与创建的群集相关联。
我是R的新手并在线搜索任何可用的解决方案,但找不到任何解决方案。是否有可能做我正在尝试的事情?
答案 0 :(得分:1)
刚才有同样的问题。这就是我做的。不确定它是否正确但似乎有效
1)从你的hclust对象,创建一个只有有序列的新对象
hh1 = hclust(dist(dataMatrix))
DataMatrixOrdered= data.frame(hh1$order)
2)组合有序数据帧和原始数据
DataMatrixOrderedCbind = cbind(dataMatrix, DataMatrixOrdered[,1])