Question

我正在尝试对我的字符串数组进行标记，并将它们转换为正式的序列。但是，当我尝试运行以下代码时，出现错误。

tokenizer = Tokenizer(num_words=20000)
tokenizer.fit_on_texts(txt)
sequences = tokenizer.texts_to_sequences(txt)

这是我的错误消息：

__init__() got an unexpected keyword argument 'num_words'

有人可以告诉我为什么吗？我该如何解决？另外，我的txt数组的长度约为5000，而10个字符串中的第一个看起来像这样：

[＆＃39;据说我今年接种流感疫苗，我会鼓励身边有老人或小孩的人也能接受这种疫苗＆＃39;，＆＃34; RT @EWJJr：鸟之间的区别流感和猪流感：对于禽流感，你会得到推特。对于猪流感，你得到了解决方案。 /那很糟糕它很好＆＃34;，＆＃39;伊利诺伊州在4周内接种了猪流感疫苗＆＃34;＆＃34; RT @EWJJr：禽流感与疾病的区别猪流感：对于禽流感，你会得到推特。对于猪流感，你得到了解决方案。 /那太糟糕了，＃34;，＃34;你一定是在开玩笑吧......我身边的每个人都生病了，我开玩笑说生病和嘲笑流感疫苗。我现在正在受伤...... Blah＆＃34;，＆＃39;为她的身体做了灰烬，我们都被卡住了！ WTF？＆＃39;，＆＃39; RT @WatchBirds鸟类新闻：Missoula水禽测试了禽流感，＆＃39;让我的流感疫苗然后照看孩子。＆＃39;，＆＃39;我知道它不是＆＃34;猪流感＆＃34;！没有冲动在泥里屎和在里面翻滚的冲动。不是＃34;禽流感＆＃34; - 没有poopin \＆＃39;在挡风玻璃或雕像上。＆＃39;，＆＃39; @thatoneguybob我知道我害怕我会得到猪流感＆＃39;]```

Answer 1

我怀疑你正在使用Keras 1.x.升级到Keras 2.x应该修复它。

当我尝试使用keras来标记我的txt字符串数组时，参数错误

1 个答案: