如何使用时间序列数据集创建单个值?

时间:2014-03-18 02:20:43

标签: python vector machine-learning data-mining scikit-learn

我有以下数据集(265个数据集)。它是一个心跳数据集,每隔1秒收集一次。

**Heart rate pattern**
82 82 87 87 89 90 89 89 89 89
88 89 89 87 87 87 88 88 90 90
87 80 88 88 88 88 91 93 92 92
89 89 89 88 79 79 79 79 78 77
...

这些天我正在使用scikit-learn python开发机器学习算法来预测患者的危急情况。因为我得到了其他12个参数(风险因素),应该与上述心率模式一起训练。由于完全训练这些心率模式和其他12个参数并不是一个好习惯,我只需要找到一种方法,使用任何数学方法将这些时间序列数据集(心率模式)设置为单个值技术。它可能是矢量但我不知道该怎么做!基于python scikit-learn的示例代码将非常有用。

1 个答案:

答案 0 :(得分:1)

其他变量是否随时间而变化?每位患者有多少心跳数据?没有更多信息,很难回答。捕获心脏跳动的持续时间需要相同才能进行充分的比较。但是,这里有一些想法:

  1. 计算一些摘要统计信息,例如时间序列中的均值,中位数,模式,最小值和最大值。
  2. 计算时间序列中的移动平均线,例如简单移动平均线和指数移动平均线。
  3. 计算每个数据点的标准差
  4. 这将为您提供时间序列的多个数字,但这可能对您的模型更好,因为它更完整地描述了时间序列。