在这种情况下,什么类型的机器学习技术使用?

时间:2015-05-10 16:46:49

标签: machine-learning

我发现了以下问题:

enter image description here

我做了以下预先假设,我想如果有人能帮我看看他们是对还是错:

  • 我认为有必要对数据进行预处理,因为价格和数量可以是不同的比例,例如:每种糖果的售价,以千美元计,以吨或其他公制单位计量。

  • 乍一看,我可以看到可以使用神经网络技术,多层nn可能使用反向传播算法。输入数据可以是十年来我们销售的价格,每种糖果的销售数量以及竞争对手销售的价格;输出的三个神经元,每个神经元代表每种糖果的销售量。

  • 我不确定是否可以使用线性回归技术,因为数据可能没有线性特征,而某些功能会使我的预测模型无效。

  • 可以使用逻辑回归,我建议在这种情况下可以使用one vs all的模型,因为我们将有三个输出,每个类型的糖果各一个。投入可以是竞争对手每种类型糖果的销售价格,我们销售的数量和我们销售的价格(全部超过十年)。

除了注意:我还可以使用过去2年市场上糖果的数量作为输入,但在这里我将不得不重新调整它,因为我使用了10年的时间段。

  • 聚类?我不知道如何在这里使用它。

任何帮助?

1 个答案:

答案 0 :(得分:1)

似乎是一个多项选择题("以下哪个......算法......?"),但你没有明确地告诉我们什么这些替代品都是。

在没有更多信息的情况下真的无法说出来,但这里有一些想法。

他们要求数字结果=>这是一个回归问题。

他们不是要求概率或相对优势:=>不是逻辑回归问题(无论如何都用于分类/分类响应变量)。我认为,虽然有一些假设+数据处理,你可以将它视为回归问题。

此处线性回归似乎很好,尽管某些属性(caketype)是名义/分类。大多数统计软件包的线性模型函数可以解决这个问题。

fit = lm(q~price + price_of_competitors + year | caketype)

没有群集。没有神经网络。

也许可以使用NN,但它更像是一个黑盒子(应用logit功能)给我。它似乎不是正确的工具,因为这是价格p和数量之间的简单线性关系的问题。