如何使用R语言

时间:2017-01-27 12:04:59

标签: r

我试过的是

reddit <-read.csv('movie_metadata.csv')
reddit <- na.omit(reddit)
View(reddit)
facebook<-reddit[1:50,c(2,9,23)]

samp2 <- facebook[,-2]
rownames(samp2) <- facebook[,2]
samp2
samp.with.rownames <- data.frame(facebook[,-2], row.names=facebook[,2])
row.names(facebook)<-reddit$director_name[1:50]
d<-dist(as.matrix(samp.with.rownames))
e<-log(d)
hc<-hclust(d)
plot(hc,cex=0.8,las=1)

即使采用不同的方法,我得到的是第2列中的数字而不是名称或文字

1 个答案:

答案 0 :(得分:1)

欢迎来到SO。

首先,我完全不明白为什么要将索引号更改为文本。文本需要是唯一的才能使其工作和知道,导演名称将不是唯一的。

相反,将具有导演名称的列添加到数据集,并在保存数据帧时使用:

write.csv(samp2, row.names = F)

第二件事,你的例子是不可复制的,如果你包括你将索引改为字符的目的,这不会有问题。

这可能对你有帮助吗?

Changing index to unique name

试着深入研究?hclust

也许你需要的是创建2列的数据框,使用1作为距离,第二个作为hclust中的标签:

hclust(d, labels = TRUE)

祝你好运:)