如何使用具有不同数据类型的特征进行预测?

时间:2019-09-19 03:28:57

标签: python python-3.x machine-learning data-science

我有一组数据(日期,数量,类别,国家/地区,州,单价,净销售额,总利润)

你们能用python代码帮助我如何使用所有功能预测“总利润”。功能具有不同的数据类型。我尝试了很多方法,但是没有运气。

谢谢

2 个答案:

答案 0 :(得分:0)

您要解决的机器学习(ML)问题类型是ML回归问题。有很多模型可以尝试。

我建议您尝试使用随机森林回归器。看一下这篇中等帖子:A Beginners Guide to Random Forest Regression

在这种情况下,您的主要朋友会 scikit-learn 图书馆。您将从这个关于机器学习的kaggle微课程中受益匪浅:Intermediate Machine Learning

您可能想看看UdemyCoursera上的一些机器学习课程。

我希望这会有所帮助。

答案 1 :(得分:0)

首先,您需要对独立功能(日期,数量,类别,国家,州,单价,净销售额)进行数据工程,然后可以应用机器学习模型来预测目标变量(总利润)。

本文可能对您有帮助,因为它清楚地说明了什么是EDA以及如何处理不同的变量
https://www.analyticsvidhya.com/blog/2016/01/guide-data-exploration/

完成数据工程后,您将应用回归模型(线性,随机森林或svm ...)