树状图具有200多个层次。我想将它放在具有簇名称的表中,并希望它更加可视化,因为它很混乱
vehicles=read.csv("data2.csv")
str(vehicles)
length(unique(vehicles$model2))
head(unique(as.character(vehicles$model2)))
uniquemodels <- unique(as.character(vehicles$model2))
唯一名称之间的字符串距离,这给出了距离
distancemodels<- stringdistmatrix(uniquemodels,uniquemodels,method="jw")
rownames(distancemodels)<-uniquemodels
使用距离进行聚类
hc <-hclust(as.dist(distancemodels))
plot(hc)
Myy预期结果
table :
Column1-Cluster name
Column2-model name