例如,我有一个3 x 3数据框,并且所有值都是文本。 在我使用'texts_to_sequences'之后 我尝试使用'pad_sequences',但是不能。
cols = df_train.columns[2:]
all_cols = pd.Series(df_train[cols].values.ravel('F'))
embed_size = 300
maxlen = 150
embed_features = 50000
tokenizer = Tokenizer(num_words=embed_features)
tokenizer.fit_on_texts(list(all_cols))
for col in cols:
df_train[col] = tokenizer.texts_to_sequences(df_train[col])
df_test[col] = tokenizer.texts_to_sequences(df_test[col])
完成上述步骤后,我使用了“ pad_sequences”
df_train = pad_sequences(df_train, maxlen=maxlen)
我希望它将在数组中显示[0, 0,0,0,...,321,421,3]
但是,它显示[0]