用于提取特定列的示例R代码

时间:2019-03-18 22:58:33

标签: r

我的数据如下:

      FlightID FareClass FareClassRank FareValue Bookings
1 YULCDG215135         Q             1       100        5
2 YULCDG215135         X             2       150        7
3 YULCDG215135         V             3       200        4
4 YULCDG215135         Y             4      1000        2
5 YULCDG215136         Q             1       120        1
6 YULCDG215136         X             2       200        4
7 YULCDG215136         V             3       270        5
8 YULCDG215136         Y             4       900       15

问题:我需要在R中编写简单的代码:

对于每个航班,票价类别的价值与其下一个票价类别的价值之比。

例如,X是Q的下一个票价舱位,V是X的下一个票价舱位,依此类推。

YULCDG215135的飞行比对于X是100/150 = 0.6667,对于V是150/200 = 0.75,依此类推。

3 个答案:

答案 0 :(得分:3)

这是使用by的基本R解决方案。

by(df, df$FlightID, function(x) c(NA, exp(-diff(log(x$FareValue)))))
#df$FlightID: YULCDG215135
#[1]        NA 0.6666667 0.7500000 0.2000000
#------------------------------------------------------------
#df$FlightID: YULCDG215136
#[1]        NA 0.6000000 0.7407407 0.3000000

或者使用ave

transform(df, ratio = ave(FareValue, FlightID, FUN = function(x) c(NA, exp(-diff(log(x))))))
#      FlightID FareClass FareClassRank FareValue Bookings     ratio
#1 YULCDG215135         Q             1       100        5        NA
#2 YULCDG215135         X             2       150        7 0.6666667
#3 YULCDG215135         V             3       200        4 0.7500000
#4 YULCDG215135         Y             4      1000        2 0.2000000
#5 YULCDG215136         Q             1       120        1        NA
#6 YULCDG215136         X             2       200        4 0.6000000
#7 YULCDG215136         V             3       270        5 0.7407407
#8 YULCDG215136         Y             4       900       15 0.3000000

两种情况下的技巧都是对FareValue进行对数转换,以便我们可以使用diff,然后反转转换(使用exp)以给出比率。

答案 1 :(得分:2)

require(dplyr) 
df %>% 
group_by(FlightID) %>% 
arrange(FareClassRank) %>%
mutate(ratio=FareValue/lead(FareValue)) 

答案 2 :(得分:0)

尝试一下:

df$FareOverNext <- unlist(lappy(split(df$FareValue, df$FlightID), {
 c(1, x[1:(length(x) - 1)] / x[2:length(x)])
}))

编辑:

感谢@thelatemail评论,添加了lapplysplit