我有一个多维数据集(3500,10),其中有一个我想要预测的二进制变量y(3500,1)。所以我使用以下代码分隔X和y,并创建一个60步时的数据结构,用作LSTM网络的输入:
data_set = data_set.as_matrix() # Using multiple predictors.
X_total = []
y_total = []
n_future = 1 # Number of days you want to predict into the future
n_past = 60 # Number of past days you want to use to predict the future
for i in range(60, len(data_set)):
X_total.append(data_set[i-n_past:i, :9])
y_total.append(data_set[i+n_future-1:i + n_future, 9])
X_total, y_total = np.array(X_total), np.array(y_total)
然后我得到X_total(3460,60,9)和y_total(3460,1)
我怎样才能确定NN使用X_total匹配y_total的每个obs? 这有点令人困惑,当我查看X_total数据时,它似乎从原始data_set的第一个obs和60th的y_total开始。 我怎么检查呢?