tensorflow用于处理可变长度的文本

时间:2018-02-11 15:10:27

标签: python tensorflow rnn

我正在计划实施RNN,当我尝试进行预处理时,有一个问题,我使用VocabularyProcessor来执行我的文本内容的转换数。例如,我有一个文本列表:

a = ['I am yours','you are','today is friday']
vocab_processor = learn.preprocessing.VocabularyProcessor(3)
print (x_train)

结果是:

[[1 2 3]
 [4 5 0]
 [6 7 8]]

实际上,我只希望第二行是[4,5]而不是0 例如,如果b = ['tomorrow is a good friday','you']中有两个新文本,我希望结果是:

[[0 7 0 0 8]
 [4]]

而不是np.array(list(vocab_processor.transform(b)))

[[0 7 0]
 [4 0 0]]

任何想法?

0 个答案:

没有答案