dcast和data.frame的公式

时间:2017-05-22 04:50:37

标签: r reshape reshape2 dcast

我有activeElm.addEventListener('change', function(){ console.log(activeElm.selectedIndex); }); data.frame:A01,A02,...,A25,...,Z01,...,Z25(共26 * 25)。例如:

colnames

我希望set.seed(1) df <- data.frame(matrix(rnorm(26*25),ncol=26*25,nrow=1)) cols <- c(paste("0",1:9,sep=""),10:25) colnames(df) <- c(sapply(LETTERS,function(l) paste(l,cols,sep=""))) dcast的26x25(行将是A-Z和列01-25)。知道这个data.frame的公式是什么?

3 个答案:

答案 0 :(得分:1)

删除列并不好看(仍在学习data.table)。有人需要让那个好。

# convert to data.table
df <- data.table(df)

# melt all the columns first
test <- melt(df, measure.vars = names(df))

# split the original column name by letter
# paste the numbers together
# then remove the other columns
test[ , c("ch1", "ch2", "ch3") := tstrsplit(variable, "")][ , "ch2" := 
paste(ch2, ch3, sep = "")][ , c("ch3", "variable") := NULL]

# dcast with the letters (ch1) as rows and numbers (ch2) as columns
dcastOut <- dcast(test, ch1 ~ ch2 , value.var = "value")

然后只删除包含该数字的第一列?

答案 1 :(得分:1)

我们可以使用tidyverse

library(tidyverse)
res <- gather(df) %>%
           group_by(key = sub("\\D+", "", key))  %>% 
           mutate(n = row_number()) %>%
           spread(key, value) %>%
           select(-n)
dim(res)
#[1] 26 25

答案 2 :(得分:1)

您正在寻找的“公式”可以来自 patterns 的“data.table”实现中的melt参数。 dcast用于从“长”形式转变为“宽”形式,而melt用于从宽形式转变为长形式。 melt()不使用formula方法。

基本上,您需要执行以下操作:

library(data.table)
setDT(df)                     ## convert to a data.table
cols <- sprintf("%02d", 1:25) ## Easier way for you to make cols in the future
melt(df, measure.vars = patterns(cols), variable.name = "ID")[, ID := LETTERS][]