Question

我试过的是

reddit <-read.csv('movie_metadata.csv')
reddit <- na.omit(reddit)
View(reddit)
facebook<-reddit[1:50,c(2,9,23)]

samp2 <- facebook[,-2]
rownames(samp2) <- facebook[,2]
samp2
samp.with.rownames <- data.frame(facebook[,-2], row.names=facebook[,2])
row.names(facebook)<-reddit$director_name[1:50]
d<-dist(as.matrix(samp.with.rownames))
e<-log(d)
hc<-hclust(d)
plot(hc,cex=0.8,las=1)

即使采用不同的方法，我得到的是第2列中的数字而不是名称或文字

Answer 1

欢迎来到SO。

首先，我完全不明白为什么要将索引号更改为文本。文本需要是唯一的才能使其工作和知道，导演名称将不是唯一的。

相反，将具有导演名称的列添加到数据集，并在保存数据帧时使用：

write.csv(samp2, row.names = F)

第二件事，你的例子是不可复制的，如果你包括你将索引改为字符的目的，这不会有问题。

这可能对你有帮助吗？

Changing index to unique name

试着深入研究？hclust

也许你需要的是创建2列的数据框，使用1作为距离，第二个作为hclust中的标签：

hclust(d, labels = TRUE)

祝你好运：）

如何使用R语言

1 个答案: