我有30个具有26个特征的时间步,所以我可以想象我输入到第一层的尺寸为#_samples x 30 x 26。
我遇到的一个问题是,我的样本数量随时间步长而变化。我应该把它们弄均匀吗?
另一种是,我试图通过将数据集分成各自的时间步长并将它们组合成3D数组来创建时间索引3D数组,但是到目前为止,我尝试过的所有不同方法都失败了。 / p>
这是我最近的尝试:
def lstm_data_processing(X_data, Y_data):
num_time_steps = X_data['month_id'].nunique()
month_ids = X_data['month_id'].unique()
X_processed = []
X_processed.reshape(X_data.shape[0], X_data.shape[1], num_time_steps)
for i in range(num_time_steps):
month_df = X_data.loc[X_data['month_id'] == month_ids[i]].copy()
month_df.drop('month_id', axis=1, inplace=True)
print(month_df.shape)
np.stack(X_processed, month_df)
print(X_processed.shape)