如何将hclust集群关联回源数据框

时间:2016-01-28 02:52:16

标签: r text-mining hierarchical-clustering

我使用hclust函数在数据框中聚类基于文本的字段。为此我必须做一些文本清理,因此我提取文本数据以使用tm_map函数。之后我应用了一个聚类算法。

群集工作正常,但我不知道如何将原始数据框与创建的群集相关联。

我是R的新手并在线搜索任何可用的解决方案,但找不到任何解决方案。是否有可能做我正在尝试的事情?

1 个答案:

答案 0 :(得分:1)

刚才有同样的问题。这就是我做的。不确定它是否正确但似乎有效

1)从你的hclust对象,创建一个只有有序列的新对象

hh1 = hclust(dist(dataMatrix))
DataMatrixOrdered= data.frame(hh1$order)

2)组合有序数据帧和原始数据

DataMatrixOrderedCbind = cbind(dataMatrix, DataMatrixOrdered[,1])