R-带条件的转置列和行

时间:2019-02-15 05:46:48

标签: r

我正在使用数据框“ by_class_survival”,并且尝试以其他格式进行转换,更改行和列以及包括条件在内,我已经以一种非常粗糙的方式解决了问题,所以我想知道是否存在更好的转置列和行的方法,以及此刻添加条件以创建转置。

library(dplyr)

titanic_tbl <- dplyr::tbl_df(Titanic)
titanic_tbl <- titanic_tbl %>%
mutate_at(vars(Class:Survived), funs(factor))
by_class_survival <- titanic_tbl %>%
group_by(Class, Survived) %>%
summarize(Count = sum(n))

原始数据框

# Class Survived Count
# 1 1st   No         122
# 2 1st   Yes        203
# 3 2nd   No         167
# 4 2nd   Yes        118
# 5 3rd   No         528
# 6 3rd   Yes        178
# 7 Crew  No         673
# 8 Crew  Yes        212

根据by_class_survival的值创建新的数据框

first <- c(122,203)
second <- c(167, 118)
third <- c(528,178)
crew <- c(673,212)

titanic.df = data.frame(first,second,third,crew)

library(data.table)
t_titanic.df <- transpose(titanic.df)
rownames(t_titanic.df) <- colnames(titanic.df)
colnames(t_titanic.df) <- c("No survivor", "Survivor")

预期结果

##        No survivor Survivor
## first          122      203
## second         167      118
## third          528      178
## crew           673      212

有更好的方法来达到预期的结果吗?

1 个答案:

答案 0 :(得分:0)

您可以使用reshape2::dcast一步完成此操作:

library(reshape2)
library(dplyr)

titanic_tbl %>%
 dcast(Class ~ Survived, value.var = "n", sum)

  Class  No Yes
1   1st 122 203
2   2nd 167 118
3   3rd 528 178
4  Crew 673 212

或者您可以在汇总数据框中使用tidyr::spread

library(tidyr)
titanic_tbl %>%
  group_by(Class, Survived) %>% 
  summarise(sum = sum(n)) %>%
  spread(Survived, sum)

# A tibble: 4 x 3
# Groups:   Class [4]
  Class    No   Yes
  <chr> <dbl> <dbl>
1 1st     122   203
2 2nd     167   118
3 3rd     528   178
4 Crew    673   212