我想在 Pytorch 中创建一个自定义数据集类和 Dataloader,它对来自带有 n
行(观察)和 m
列(特征)的 Pandas 数据帧的数据进行预处理。
我特别想要的是一个加载张量的数据加载器,其中 tensor.shape = torch.Size([1, num_features, num_sequence])
其中 num_features
是一个数字,对应于特征的数量 (m
) 和 {{1} } 指的是时间窗口大小 num_sequence
并包含特征的相应值。此外,如果我选择 w
作为数字 x,数据加载器应该返回几个张量,这样:
batch_size
到目前为止,我只设法创建了一个每次加载一个功能的类,batch_size 将第一个条目移动一个,这样:
BatchIndex 1, tensor.size([1, num_feat, time_window with rows 1 - w])
BatchIndex 2, tensor.size([1, num_feat, time_window with rows w+1 - 2w])
...
BatchIndex X, tensor.size([1, num_feat, time_window with rows n-w - n])
通过使用以下代码:
BatchIndex1: Tensor([1,2,3], [2,3,4], [3,4,5])
BatchIndex2: Tensor([4,5,6], [5,6,7], [7,8,9])
etc.
有人知道如何解决这个问题吗?