2个因素的初学者R预测模型

时间:2018-05-15 16:35:52

标签: r rpart predictive

我正在尝试建立一个模型,以预测我们的某个办事处在一个月内将完成多少笔交易。

我开始尝试使用这篇文章学习如何构建这样的模型:https://medium.com/@davidsb/datascience-for-developers-build-your-first-predictive-model-with-r-a798f684752f

然而,他们正在构建的模型似乎是1个因素。理想情况下,我希望能够选择month = January, office = Atlanta,并且输出结果将是亚特兰大办事处1月份预计会做的交易数量的估计。

我的数据集按以下方式组织:

Office   DealMonth   DealYear   CountDeals 
Atlanta  1           2015       10
Atlanta  2           2016       35

是否有一种简单的方法来调整文章中概述的基本模型以获得我想要的结果?

编辑:代码如下:

dat = read.csv("RawDataDealCountSummary.csv")
head(dat)

str(dat)

dat$DealMonth = factor(dat$DealMonth)

train_data = dat[dat$DealYear<2017,]
test_data = dat[dat$DealYear == 2017,]

head(train_data)
head(test_data)

test_counts <- test_data$DealCount

plot(dat$ï..DealOffice, dat$DealCount)

model=rpart(DealCount ~ ï..DealOffice + DealMonth, train_data,)

p = predict(model, test_data)
plot(p - test_counts)

predict(model, data.frame(ï..DealOffice = factor('Atlanta'), DealMonth = factor(12)))

0 个答案:

没有答案