我已阅读以下文档,并对合成数据集进行了一些实验:
https://arxiv.org/abs/1711.09919
我不太确定作者对自动编码器输入采用什么格式。 我正在使用Keras和Tensorflow并构建具有尺寸的张量:
(样本,时间步长,功能)
因此,我尝试为每个样本构建以下功能(这是8分):
[0 0 0 0 0 0 x1 x2
0 0 0 0 0 x1 x2 x3
0 0 0 0 x1 x2 x3 x4
0 0 0 x1 x2 x3 x4 x5
0 0 x1 x2 x3 x4 x5 x6
0 x1 x2 x3 x4 x5 x6 x7
x1 x2 x3 x4 x5 x6 x7 x8
x2 x3 x4 x5 x6 x7 x8 0
x3 x4 x5 x6 x7 x8 0 0
x4 x5 x6 x7 x8 0 0 0
x5 x6 x7 x8 0 0 0 0
x6 x7 x8 0 0 0 0 0
x7 x8 0 0 0 0 0 0
x8 0 0 0 0 0 0 0
我认为以下文章中也提到了这一点:
https://www.isca-speech.org/archive/archive_papers/interspeech_2012/i12_0022.pdf
问题是,我得到的结果非常差,并且只有在使用长滑动窗口的情况下,时间序列的噪点才很小。 以下是快照:
signal and denoised time series
有人知道如何正确格式化输入吗?