我使用R学习编程,并在季节性销售方面得到以下提示:
在新模型中,给出两个相同的月度周期;预测伊兰特销售的绝对差异是什么,因为一个时期是一月,一个是三月?
我主要使用子集" train"在
elantra=read.csv("Week3_elantra.csv")
train=subset(elantra, Year<=2012)
我设置了一个表,以便查看每个月(1:12)的ElantraSales的值,让我知道是否有更好的方法来执行此操作,其中它返回每个ESales值的二进制表
table(train$ElantraSales, train$Month)
我试图通过总结第1个月和第3个月的ElantraSales值来解决原始问题,然后减去它们以找出差异
答案 0 :(得分:1)
如果目标是返回一个反映每个月总销售额的对象,而不考虑年份,那么这是一个潜在的dplyr
解决方案。
library(dplyr)
elantra <- read.csv("Week3_elantra.csv")
elantra <- elantra %>%
filter(Year > 2012) %>%
group_by(Month) %>%
summarise(sales = sum(ElantraSales))
delta <- elantra$sales[which(elantra$Month == 1)] - elantra$sales[which(elantra$Month == 3)]
如果您需要每年每月的总销售额,请在Year
功能中在月之前添加group_by
。另外,请确保Year
值为数字而非字符或使用as.numeric
转换,否则过滤器将无法正常工作。