我正在计划实施RNN,当我尝试进行预处理时,有一个问题,我使用VocabularyProcessor
来执行我的文本内容的转换数。例如,我有一个文本列表:
a = ['I am yours','you are','today is friday']
vocab_processor = learn.preprocessing.VocabularyProcessor(3)
print (x_train)
结果是:
[[1 2 3]
[4 5 0]
[6 7 8]]
实际上,我只希望第二行是[4,5]而不是0
例如,如果b = ['tomorrow is a good friday','you']
中有两个新文本,我希望结果是:
[[0 7 0 0 8]
[4]]
而不是np.array(list(vocab_processor.transform(b)))
:
[[0 7 0]
[4 0 0]]
任何想法?