我是R的新手,这可能会有一个简单的答案,但仍然是: 我在表格上有一个数据框
df <- data.frame(c("a", "b", "c", "d", "e"), 1:5, 7:11, stringsAsFactors=FALSE)
names(df) <- c("en", "to", "tre")
我的数据集比这更大,更多的行和列。但基本思路是一样的:我想排序n个最高的数值,与它们出现在哪个列无关,并返回一个列表,其中的值按降序排列,相应的字符串列在“en”列中。
像这样:
e 11
d 10
c 9
b 8
a 7
e 5
等等。
我怎么能完成这个?
答案 0 :(得分:3)
您可以使用包reshape2
来融合数据并对值列进行排序,如下所示:
require(reshape2)
df <- data.frame(c("a", "b", "c", "d", "e"), 1:5, 7:11, stringsAsFactors=FALSE)
names(df) <- c("en", "to", "tre")
df2 <- melt(df, id = "en")
## 'data.frame': 10 obs. of 3 variables:
## $ en : chr "a" "b" "c" "d" ...
## $ variable: Factor w/ 2 levels "to","tre": 1 1 1 1 1 2 2 2 2 2
## $ value : int 1 2 3 4 5 7 8 9 10 11
df2[order(df2$value, decreasing = TRUE), c("en", "value")]
## en value
## 10 e 11
## 9 d 10
## 8 c 9
## 7 b 8
## 6 a 7
## 5 e 5
## 4 d 4
## 3 c 3
## 2 b 2
## 1 a 1
但我确信还有其他方法可以做到这一点!!
答案 1 :(得分:0)
不太优雅,但没有额外的包(它可以使用任意数量的列):
col1<-rep(df[,1],ncol(df)-1)
col2<-c()
for(i in 2:ncol(df)) {
col2<-c(col2,df[,i])
}
newdf<-data.frame(en=col1,value=col2)
newdf<-newdf[order(as.numeric(newdf[,2]),decreasing=TRUE),]