用于多元时间序列的 Pytorch 自定义数据集类和数据加载器

时间:2021-07-30 15:14:52

标签: python pytorch pytorch-dataloader

我想在 Pytorch 中创建一个自定义数据集类和 Dataloader,它对来自带有 n 行(观察)和 m 列(特征)的 Pandas 数据帧的数据进行预处理。

我特别想要的是一个加载张量的数据加载器,其中 tensor.shape = torch.Size([1, num_features, num_sequence]) 其中 num_features 是一个数字,对应于特征的数量 (m) 和 {{1} } 指的是时间窗口大小 num_sequence 并包含特征的相应值。此外,如果我选择 w 作为数字 x,数据加载器应该返回几个张量,这样:

batch_size

到目前为止,我只设法创建了一个每次加载一个功能的类,batch_size 将第一个条目移动一个,这样:

BatchIndex 1, tensor.size([1, num_feat, time_window with rows 1 - w])
BatchIndex 2, tensor.size([1, num_feat, time_window with rows w+1 - 2w])
...
BatchIndex X, tensor.size([1, num_feat, time_window with rows n-w - n])

通过使用以下代码:

BatchIndex1: Tensor([1,2,3], [2,3,4], [3,4,5]) 
BatchIndex2: Tensor([4,5,6], [5,6,7], [7,8,9])
etc.

有人知道如何解决这个问题吗?

0 个答案:

没有答案