Scikit-学习未来值的预测区间?

时间:2016-05-30 12:20:14

标签: pandas scikit-learn

我的代码预测的数字是非常具体的,我没有得到任何完全匹配,但有些非常接近。例如,在某个日期实际上有388个事件,这可能预测397.

  • 我可以输出370 - 410的范围吗?或者看看该值在一个范围之间的百分比几率?或者我应该将这些值分类并以这种方式检查准确性吗?

代码:

new ActionBar.TabListener()

所以上面的代码为每一行放置一个值(在这种情况下是一个日期,但我根据数据集中的第一个值从1开始编号。我如何预测未来值?当我运行代码时上面我只得到现有数据的预测值,如何在其他数据集上使用该模型或输入未来日期?

1 个答案:

答案 0 :(得分:1)

假设您需要在预测值之上进行分箱,您可以使用pandas cut(),如下所示:

In [1]: import pandas as pd

In [2]: df = pd.DataFrame([270,201,375,370,410,510], columns=['prediction'])

In [3]: bins = [0,370,420,600]

In [4]: group_labels = ['(0-370]', '(371-420]', '(421-600]']

In [5]: df['prediction_range'] = pd.cut(df.prediction, bins, labels=group_labels)

In [6]: df
Out[6]: 
   prediction prediction_range
0         270          (0-370]
1         201          (0-370]
2         375        (371-420]
3         370          (0-370]
4         410        (371-420]
5         510        (421-600]

参考:Binning Data In Pandas