在数据框内取消嵌套数据框

时间:2018-10-11 16:06:57

标签: r dplyr plyr confidence-interval hmisc

我一直在尝试通过Hmisc R软件包计算二项式分布的置信区间。具体来说,我使用了binconf函数,可以完美地完成其工作。

library(plyr)
library(Hmisc)

Student <- c("A", "B", "C")
TP <- c(13, 36, 43)
obs.pos <- c(16, 37, 48)

df <- data.frame(Student, TP, obs.pos)

df1 <- df %>% 
  plyr::mutate(Sen = binconf(TP, obs.pos, alpha = 0.05, method = "wilson", return.df = TRUE))

df1 %>% View()

#  Student TP obs.pos Sen.PointEst Sen.Lower Sen.Upper
#1       A 13      16    0.8125000 0.5699112 0.9340840
#2       B 36      37    0.9729730 0.8617593 0.9986137
#3       C 43      48    0.8958333 0.7783258 0.9546783

不幸的是,我感到该函数在我的原始数据帧内创建了一个数据帧,并且不再允许我在输出中应用基本函数。例如,我无法选择列(使用dplyr)或四舍五入数字,因为R无法找到创建的列(例如Sen.PointEst,Sen.Lower,Sen.Upper)。下面是我的输出的结构。

df1 %>% str()

#'data.frame':  3 obs. of  4 variables:
# $ Student: Factor w/ 3 levels "A","B","C": 1 2 3
# $ TP     : num  13 36 43
# $ obs.pos: num  16 37 48
# $ Sen    :'data.frame':   3 obs. of  3 variables:
#  ..$ PointEst: num  0.812 0.973 0.896
#  ..$ Lower   : num  0.57 0.862 0.778
#  ..$ Upper   : num  0.934 0.999 0.955

我希望所有列都位于输出的第一级,以便可以轻松地将所有常规函数应用于输出。

感谢您的帮助!

2 个答案:

答案 0 :(得分:1)

我们在data.frame内有data.frame列。展平data.frame的一种方法是在data.frame内调用do.call

dfN <- do.call(data.frame, df1) 

或者另一个选择是在binconf之内调用do

df %>% 
  do(data.frame(., Sen = binconf(.$TP, .$obs.pos, alpha = 0.05, method = "wilson")))

答案 1 :(得分:0)

使用tidyverse包的另一个选项,可以解决缺少的值。当前,这会添加一些额外的列,这可能是一个错误?

library(tidyverse)

Student <- c("A", "B", "C", "D", "E")
TP <- c(13, 36, 43, NA, 0)
obs.pos <- c(16, 37, 48, NA, 0)



df <- data.frame(Student, TP, obs.pos)


df %>% 
  nest(TP, obs.pos) %>% 
  mutate(out = map_if(
    data, .p = ~ !is.na(.$TP) & !is.na(.$obs.pos),
    .f = ~ Hmisc::binconf(.$TP, .$obs.pos, return.df = TRUE))) %>% 
  unnest(data, out) 


 Student TP obs.pos  PointEst     Lower     Upper TP1 obs.pos1
1       A 13      16 0.8125000 0.5699112 0.9340840  NA       NA
2       B 36      37 0.9729730 0.8617593 0.9986137  NA       NA
3       C 43      48 0.8958333 0.7783258 0.9546783  NA       NA
4       D NA      NA        NA        NA        NA  NA       NA
5       E  0       0       NaN       NaN       NaN  NA       NA