建议在enchant.Dict(..)不准确

时间:2013-08-14 09:01:04

标签: python python-2.7 nlp nltk

我想实现两个部分:

  1. 我想删除每个字符串中存在的冗余字母两次以上。
  2. 在处理每个字符串的第一部分后,检查最匹配的英文单词。我正在使用python所以我使用了enchant.Dict(“en”)和enchant.Dict(“en”)。建议(..)
  3. 例如:

    Heelllllo should be Heello
    Heeeeeeeey should be Heey
    yessssssss should be yees
    

    我的问题在于2.对于“yessssssss” 我有建议的单词列表:

    ['yes', 'less', 'mess', 'fess', 'jess', 'Hess', 'yeas', 'yens', 'yews', 'yes s']
    

    所以我的问题是“是的”因为结果中的最后一个词没有意义,所以我需要更准确的结果,我的方法是否正确?,我应该考虑第1部分的变化吗?

0 个答案:

没有答案