数据Munging挑战。如何在汇总表中将正确的系数加入到正确的观察中

时间:2018-04-05 13:02:54

标签: r data-munging

在开始之前,可以在此处找到此问题的基本答案: Correctly binding coefficients to summarized table

这个问题的不同之处在于,我需要根据结点的位置将正确的系数正确地连接到摘要表中的正确位置。我使用I(pmax(0, variable - knot))技术来放置样条线。最终结果是每个变量的唯一值表,汇总度量和正确的模型统计信息(请参阅下面示例代码中的最终(尚未完成)表)。

library(tidyverse)
library(broom)

#pull in and gather data
mtcars1 <- as_tibble(mtcars)
mtcars1$cyl <- as.factor(mtcars$cyl)
#run model and produce model-summary table
model <- glm(mpg ~ cyl + hp + I(pmax(0, hp - 100)), data = mtcars1)

model_summary <- tidy(model)

#produce final summary table
summary_table <- mtcars1 %>%
  select(cyl, hp, wt) %>%
  gather(key = variable, level, - wt) %>%
  group_by(variable, level) %>%
  summarise("sum_wt" = sum(wt)) %>%
  mutate(term = paste0(variable, level)) %>%
  left_join(model_summary, by = c("term" = "term"))

挑战是在I(pmax(0, hp -100))表中使用model_summary项并正确加入估算值,std.error,统计值和p.value到summary_table中的每个hp观察值&lt; = 100,除了将其他hp估计统计数据加入到summary_table中的hp观察值之外&lt; = 100。

0 个答案:

没有答案