根据R中的列中的代码对数据进行排序

时间:2017-03-24 10:29:29

标签: r sorting transpose

我有一个包含两列的文件。一个有5位数代码,一个有计数。 以下是3位数的示例:

Code    Count
101   1254
103   1566
221   459
213   698

现在我想转置数据,以便在从最后一位开始的代码之后对其进行排序:

        10x   11x 12x 13x 14x .... 19x  20x 21x 22x 23x 
xx1   1254                                      459
xx2             
xx3   1566                                  698

感谢任何帮助。

2 个答案:

答案 0 :(得分:2)

根据你的例子,你可以这样做:

df$code_2 <- substr(df$Code, 1, 2)
df$code_1 <- substring(df$Code, 3)

看起来像:

> df
  Code Count code_2 code_1
1  101  1254     10      1
2  103  1566     10      3
3  221   459     22      1
4  213   698     21      3

然后dcast

library(reshape2)
dcast(df, code_1 ~ code2, value.var = 'Count')

  code_1   10  21  22
1      1 1254  NA 459
2      3 1566 698  NA

并正确格式化:

rownames(df2) <- paste0('xx', df2$code_1)
df2$code_1 <- NULL
names(df2) <- paste0(names(df2), 'x')

输出:

df2
     10x 21x 22x
xx1 1254  NA 459
xx3 1566 698  NA

答案 1 :(得分:0)

或者,您可以这样做:

# create a sample dataset
data <- data.frame(Code = c(101,103,221,213), Count = c(1254,1566,459,698))

# extract code start and end
start <- sort(unique(substr(data$Code, 1,2)))
end <- sort(unique(substr(data$Code, 3,3)))

# create placeholder dataframe
data2 <- sapply(start, paste0, end)
# where code not in original dataset, write NA
data2[!sapply(c(data2), '%in%', data$Code)] <- NA
# else write the appropriate count
data2[sapply(c(data2), '%in%', data$Code)] <- data$Count[order(data$Code)]
# change column and row names
colnames(data2) <- paste0(start, "x")
rownames(data2) <- paste0("xx", end)

但我猜是dcast,因为LyzandeR的答案更优雅。