关于分类方法的建议

时间:2016-06-22 11:00:48

标签: machine-learning azure-machine-learning-studio

我需要对收到的汽车租赁进行分类,但我可用于培训的历史数据是"分组"形式,我不知道如何训练分类模型。

我的收到的数据是汽车型号,数量和单价的列表:

 Chevrolet Spark, 1, 196.91
 Fiat 500, 1, 196.91
 Toyota Prius Hybrid, 3, 213.73

此传入数据目前是按类别和每组总价格进行人工分类和保存的(雪佛兰和菲亚特是经济型,普锐斯是混合型):

 Economy, 393.82
 Hybrid, 641.19

这个问题应该可以通过机器学习来解决,但我无法弄清楚如何为有监督的分类器构建训练集。任何指导意见。

由于

2 个答案:

答案 0 :(得分:0)

一个天真的贝叶斯分类器应该做你想做的事情......你可以使用价格作为使用的专长,并从已标记的内容中学习。

但是,我不知道如何使用TOTAL价格进行分类,因为您并不总是拥有从一个组到另一个组的任意数量的对象......您将不得不使用单价。

答案 1 :(得分:0)

有很多算法可以提供多类分类,但是你能解释一下你想要预测的内容吗?从你所写的内容来看,它听起来更像是ETL过程的场景,而不是机器学习模型。

如果我理解你的例子,带有“雪佛兰星火”或“菲亚特500”车型的传入记录将始终标记为“经济”,而带有“丰田普锐斯混合动力”车型的传入记录将标记为“混合”。一个简单的查找表可以在这里完成工作 - 不需要花哨的机器学习数学。 :)