标签: tensorflow tokenize word2vec
当我向Word2Vec模型添加句子时,似乎删除了以数字值结尾或以数字值开头的单词,例如“ISO 9001”作为“ISO”返回,我猜它是简单的......
提前致谢。
答案 0 :(得分:0)
我想你已经在这个问题的标签中回答了你的问题。很可能你的标记生成器按空格分割,并留下数字。如果您粘贴您在此处使用的令牌化代码,我们将能够为您提供进一步的帮助。