Word2Vec包含数值的单词

时间:2017-03-03 22:10:13

标签: tensorflow tokenize word2vec

当我向Word2Vec模型添加句子时,似乎删除了以数字值结尾或以数字值开头的单词,例如“ISO 9001”作为“ISO”返回,我猜它是简单的......

提前致谢。

1 个答案:

答案 0 :(得分:0)

我想你已经在这个问题的标签中回答了你的问题。很可能你的标记生成器按空格分割,并留下数字。如果您粘贴您在此处使用的令牌化代码,我们将能够为您提供进一步的帮助。

祝你好运!