我的数据如下:
FlightID FareClass FareClassRank FareValue Bookings
1 YULCDG215135 Q 1 100 5
2 YULCDG215135 X 2 150 7
3 YULCDG215135 V 3 200 4
4 YULCDG215135 Y 4 1000 2
5 YULCDG215136 Q 1 120 1
6 YULCDG215136 X 2 200 4
7 YULCDG215136 V 3 270 5
8 YULCDG215136 Y 4 900 15
问题:我需要在R中编写简单的代码:
对于每个航班,票价类别的价值与其下一个票价类别的价值之比。
例如,X是Q的下一个票价舱位,V是X的下一个票价舱位,依此类推。
YULCDG215135的飞行比对于X是100/150 = 0.6667,对于V是150/200 = 0.75,依此类推。
答案 0 :(得分:3)
这是使用by
的基本R解决方案。
by(df, df$FlightID, function(x) c(NA, exp(-diff(log(x$FareValue)))))
#df$FlightID: YULCDG215135
#[1] NA 0.6666667 0.7500000 0.2000000
#------------------------------------------------------------
#df$FlightID: YULCDG215136
#[1] NA 0.6000000 0.7407407 0.3000000
或者使用ave
transform(df, ratio = ave(FareValue, FlightID, FUN = function(x) c(NA, exp(-diff(log(x))))))
# FlightID FareClass FareClassRank FareValue Bookings ratio
#1 YULCDG215135 Q 1 100 5 NA
#2 YULCDG215135 X 2 150 7 0.6666667
#3 YULCDG215135 V 3 200 4 0.7500000
#4 YULCDG215135 Y 4 1000 2 0.2000000
#5 YULCDG215136 Q 1 120 1 NA
#6 YULCDG215136 X 2 200 4 0.6000000
#7 YULCDG215136 V 3 270 5 0.7407407
#8 YULCDG215136 Y 4 900 15 0.3000000
两种情况下的技巧都是对FareValue
进行对数转换,以便我们可以使用diff
,然后反转转换(使用exp
)以给出比率。
答案 1 :(得分:2)
require(dplyr)
df %>%
group_by(FlightID) %>%
arrange(FareClassRank) %>%
mutate(ratio=FareValue/lead(FareValue))
答案 2 :(得分:0)
尝试一下:
df$FareOverNext <- unlist(lappy(split(df$FareValue, df$FlightID), {
c(1, x[1:(length(x) - 1)] / x[2:length(x)])
}))
编辑:
感谢@thelatemail评论,添加了lapply
和split
。