我在CSV文件中有一个数据集,并使用pandas
通过data = pd.read_csv(filename)
阅读。然后加载文字和得分列。
我不确定将文本/分数作为kera神经网络模型的x_train / y_train提供的合适方法。我这样做:
max_fatures = 2000
tokenizer = Tokenizer(num_words=max_fatures, split=' ')
tokenizer.fit_on_texts(data['Text'].values)
X = tokenizer.texts_to_sequences(data['Text'].values)
X = pad_sequences(X)
model.fit(x_train, y_train, epochs = nb_epochs, batch_size = nb_batch_size, validation_data=(x_val, y_val))
但我在X = pad_sequences(X)
中收到内存错误。
我应该如何喂养模型?