我是R编程的新手并学习了很多R函数,但却无法理解变数数据框。由于我在Coursera学习概率和数据课程,我无法解决问题,最近我遇到了一个练习,其中有人要求变异数据框,如下所示
假设您将航班定义为"准时"如果它按时或早于预期到达目的地,无论任何出发延误。根据此定义,改变数据框以创建名为"on time"
的新变量,其级别为"delayed"
和"delayed"
。然后,根据航班是否准时离开,确定准时到达百分比。那个航班的比例是多少
是"on time"
离开到达{{1}}?
请指导我并解释如何理解这一条款?
答案 0 :(得分:1)
以下是它的工作原理:
(df <- data.frame(group=gl(2,2), value=1:4))
# group value
# 1 1 1
# 2 1 2
# 3 2 3
# 4 2 4
library(dplyr)
df %>% group_by(group) %>% mutate(avg=mean(value))
# Source: local data frame [4 x 3]
# Groups: group [2]
#
# group value avg
# (fctr) (int) (dbl)
# 1 1 1 1.5
# 2 1 2 1.5
# 3 2 3 3.5
# 4 2 4 3.5
您还可以按多个变量进行分组,例如group_by(plane, flight)
。所以你应该能够轻松到达你想要的地方。