无法在多列中使用“ pad_sequences”

时间:2019-09-05 14:35:25

标签: python tensorflow keras

例如,我有一个3 x 3数据框,并且所有值都是文本。 在我使用'texts_to_sequences'之后 我尝试使用'pad_sequences',但是不能。

cols = df_train.columns[2:]
all_cols = pd.Series(df_train[cols].values.ravel('F'))

embed_size = 300 
maxlen = 150 
embed_features = 50000 
tokenizer = Tokenizer(num_words=embed_features)
tokenizer.fit_on_texts(list(all_cols))

for col in cols: 
    df_train[col] = tokenizer.texts_to_sequences(df_train[col]) 
    df_test[col] = tokenizer.texts_to_sequences(df_test[col])

完成上述步骤后,我使用了“ pad_sequences”

df_train = pad_sequences(df_train, maxlen=maxlen)

我希望它将在数组中显示[0,  0,0,0,...,321,421,3]

但是,它显示[0]

0 个答案:

没有答案