我试过的是
reddit <-read.csv('movie_metadata.csv')
reddit <- na.omit(reddit)
View(reddit)
facebook<-reddit[1:50,c(2,9,23)]
samp2 <- facebook[,-2]
rownames(samp2) <- facebook[,2]
samp2
samp.with.rownames <- data.frame(facebook[,-2], row.names=facebook[,2])
row.names(facebook)<-reddit$director_name[1:50]
d<-dist(as.matrix(samp.with.rownames))
e<-log(d)
hc<-hclust(d)
plot(hc,cex=0.8,las=1)
即使采用不同的方法,我得到的是第2列中的数字而不是名称或文字
答案 0 :(得分:1)
欢迎来到SO。
首先,我完全不明白为什么要将索引号更改为文本。文本需要是唯一的才能使其工作和知道,导演名称将不是唯一的。
相反,将具有导演名称的列添加到数据集,并在保存数据帧时使用:
write.csv(samp2, row.names = F)
第二件事,你的例子是不可复制的,如果你包括你将索引改为字符的目的,这不会有问题。
这可能对你有帮助吗?
试着深入研究?hclust
也许你需要的是创建2列的数据框,使用1作为距离,第二个作为hclust中的标签:
hclust(d, labels = TRUE)
祝你好运:)