使用机器学习预测/延迟预测?

时间:2012-05-23 13:38:28

标签: matlab machine-learning data-mining weka data-analysis

我有一套过去5年的数据。大约7000行数据,具有二进制{是/否}或多类{产品A,B,C}的功能。共有大约20多个功能。

我正在尝试制作一个程序(或一次性分析项目),以根据此历史数据确定(预测)产品发货日期(发货延迟天数)。我有2列表示产品计划何时发货,另外一列是实际发货的时候!目前。

我想知道如何制作预测程序,根据历史数据确定产品的新数据输入何时发货。我不关心获得具体日期,但即使只是一个可以告诉我添加延迟天数的程序......

我一段时间参加了ML课程,我不知道如何开始这样的课程。有什么建议?另外,我能想到的最接近的是使用NN的图像识别分配。但这太简单了,我必须处理一个日期而不是像素白/黑....我在当天使用Matlab(我仍然知道如何使用它)但我刚刚下载了Weka数据挖掘工具。

我在想一个神经网络,但我不知道如何设置它让我的程序从输入的发货日期给我一个预期的延迟时间(天数/月)。

基本上,

我想输入(size = 5,prod = A,....,预计发货日期= 1月1日)

并且程序会根据历史趋势返回延迟到我预期发货日期的天数......

非常感谢任何有关如何以正确/最简单/最佳方式开始此类活动的任何帮助...提前致谢。

1 个答案:

答案 0 :(得分:0)

如果您使用weka,那么将您的输入/标签数据转换为arff格式,然后尝试所有不同的regressors(这毕竟是回归问题)。为了避免必须进行太多的编程(如果您刚刚处于探索阶段),请使用具有GUI的weka experimenter在您的数据集上尝试一大堆回归量。

然后,当您找到一个可以完成某项工作并希望使用MATLAB进行更多数据分析时,您可以使用weka/matlab interface