我正在尝试对我的字符串数组进行标记,并将它们转换为正式的序列。但是,当我尝试运行以下代码时,出现错误。
tokenizer = Tokenizer(num_words=20000)
tokenizer.fit_on_texts(txt)
sequences = tokenizer.texts_to_sequences(txt)
这是我的错误消息:
__init__() got an unexpected keyword argument 'num_words'
有人可以告诉我为什么吗?我该如何解决?另外,我的txt数组的长度约为5000,而10个字符串中的第一个看起来像这样:
['据说我今年接种流感疫苗,我会鼓励身边有老人或小孩的人也能接受这种疫苗'," RT @EWJJr:鸟之间的区别流感和猪流感:对于禽流感,你会得到推特。对于猪流感,你得到了解决方案。 /那很糟糕它很好",'伊利诺伊州在4周内接种了猪流感疫苗"" RT @EWJJr:禽流感与疾病的区别猪流感:对于禽流感,你会得到推特。对于猪流感,你得到了解决方案。 /那太糟糕了,#34;,#34;你一定是在开玩笑吧......我身边的每个人都生病了,我开玩笑说生病和嘲笑流感疫苗。我现在正在受伤...... Blah",'为她的身体做了灰烬,我们都被卡住了! WTF?',' RT @WatchBirds鸟类新闻:Missoula水禽测试了禽流感,'让我的流感疫苗然后照看孩子。','我知道它不是"猪流感"!没有冲动在泥里屎和在里面翻滚的冲动。不是#34;禽流感" - 没有poopin \'在挡风玻璃或雕像上。',' @thatoneguybob我知道我害怕我会得到猪流感']```
答案 0 :(得分:0)
我怀疑你正在使用Keras 1.x.升级到Keras 2.x应该修复它。