如何在nltk python中处理UnigramTagger中的拼写错误?

时间:2016-03-30 12:54:50

标签: python nltk fuzzywuzzy

我正在使用python nltk库进行命名实体识别。我使用UnigramTagger来自定义标记标记。它的发生完全正常。 问题是标记器正好标记到我在模型中提到的单词。如果有任何拼写错误,则无法找到该单词。 我该如何解决这个问题? 我喜欢fuzzywuzzy允许比率搜索,但不知道任何nltk标记器是否提供了相同的功能。需要一些帮助。谢谢。

1 个答案:

答案 0 :(得分:0)

您需要在命名实体识别之前更正拼写。您可以通过以下网址进行此操作..

spell checker