Question

在培训期间，我的数据集正在减少。我不知道是什么原因造成的。 Ive填充了X并使用了测试火车拆分

max_features = 4500
X = pad_sequences(sequences = X, maxlen = max_features, padding = 'pre')
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 101)

X_train.shape

(17983, 4500)

y_train.shape

(17983,)

这是我的lstm算法

lstm_model = Sequential(name = 'lstm_nn_model')
lstm_model.add(layer = Embedding(input_dim = max_features, output_dim = 120, name = '1st_layer'))
lstm_model.add(layer = LSTM(units = 120, dropout = 0.2, recurrent_dropout = 0, name = '2nd_layer'))
lstm_model.add(layer = Dropout(rate = 0.5, name = '3rd_layer'))
lstm_model.add(layer = Dense(units = 120,  activation = 'relu', name = '4th_layer'))
lstm_model.add(layer = Dropout(rate = 0.5, name = '5th_layer'))
lstm_model.add(layer = Dense(units = len(set(y)),  activation = 'sigmoid', name = 'output_layer'))
lstm_model.compile(optimizer = 'adam', loss = 'sparse_categorical_crossentropy', metrics = ['accuracy'])


lstm_model_fit = lstm_model.fit(X_train, y_train, epochs = 2)

当纪元开始运行时，时间是1/17983。现在，当我重新运行时，它是1/562。请注意，我是新手，我只是运行现有代码来学习。为什么会这样。

Answer 1

当您用数据拟合模型时，GPU必须加载所有数据并对其进行处理。如果GPU同时加载17983数据，它将耗尽内存。因此，将数据放入“批处理”中，这些批处理是一起处理的数据组。标准尺寸为32，如果您将17983/32 = 561.96875进行了四舍五入。

为什么训练时我的数据集减少了？

1 个答案: