library(tidyverse)
library(nycflights13)
带有值的小标题(这些值表示平均播音时间的差异)
origin mean_air_time
<chr> <dbl>
1 EWR 153.
2 JFK 178.
3 LGA 118.
我如何在R中找出这些差异是否在统计上有所不同?
我尝试做的是(向航班添加一个带有均值的额外col):
mutation <- flights %>%
group_by(origin) %>%
mutate(meanAir_time = mean(air_time, na.rm = TRUE))
现在尝试使用带有新列的数据创建线性模型
value <- lm(dep_time ~ meanAir_time, data = mutation)
最后显示结果:
coef(summary(lModel))
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1135.064406 5.33534358 212.74439 0
meanAir_time 1.420515 0.03495606 40.63716 0
我非常关心结果Pr(>|t|)
,看到结果> 5%
会说有很大的不同,但是,我担心我做对了。我不确定是否应该在dep_time
lm(...)