将曲线拟合到一组数据点以进行时间序列预测

时间:2014-05-12 16:19:51

标签: python numpy scipy scikit-learn

我目前有一组数据点(命中计数),这些数据点的结构为时间序列。数据类似于:

time   hits
20     200
32     439
57     512

如何为此数据拟合曲线或找到公式以便我可以预测未来的点数?理想情况下,我可以回答一个问题,例如“当时间是100时会有多少次观看?”

感谢您的帮助!

编辑:到目前为止我尝试过的事情:

我尝试过各种方法,包括:

  1. 使用sklearn创建Logistic回归(但是,没有数据功能)

  2. 使用scipy中的optimize.curve_fit创建曲线拟合(但是,我没有数据函数)

  3. 从UnivariateSpline创建一个函数以传递给curve_fit(出了点问题,我无法将其固定下来)
  4. 我正试图在内容变成病毒时建模,所以我假设多项式或指数曲线是理想的。

    我之前尝试过来自@Bill的链接,但我没有数据功能。你知道我怎么找到一个吗?

    编辑2:

    以下是大约两天数据的示例: The Fox Data

    Here是预期的。

1 个答案:

答案 0 :(得分:1)

正如其他人所说,很难用很少的信息给出答案。

我建议您定义一些新变量,如时间,时间*时间,时间*时间*时间,并使用此变量拟合LinearRegression模型作为输入变量。

我将从这些开始,然后使用更复杂的东西,如神经网络(不是在sklearn中)或SVR。

希望这可以提供帮助。