Tensorflow中多维时间序列预测中的向量表示

时间:2016-11-04 17:19:46

标签: tensorflow time-series prediction

我有一个大型数据集(大约3000万个数据点,包含5个功能),我使用K-means减少了200,000个集群。数据是一个时间序列,时间步长约为150,000。我想要训练模型的数据是每个时间步的特定聚类的存在。预测模型的目的是生成类似于从在单词序列上训练的模型生成语法正确的句子的通用序列。考虑这些数据的最简单方法是,我尝试从当前视频帧中的像素预测下一个视频帧中的像素,以便生成接近原始序列的新帧序列。

每个时间步的原始和稀疏表示将是200,000个二进制值,表示在该时间步存在或不存在哪些簇。注意,在任何一个时间步长中可能不会有超过200个簇,因此这种表示非常稀疏。

将此稀疏矢量转换为更适合使用Tensorflow进行时间序列预测的密集矢量的最佳表示是什么?

我最初考虑过在每个时间步骤对矢量进行训练的RNN / LSTM,但由于训练矢量的大小,我现在想知道卷积方法是否更合适。

注意,除了一些简单的教程,我还没有实际使用过张量流,但之前已经使用过OpenCV ML函数。请在回复中认为我是新手。

谢谢。

0 个答案:

没有答案