我正在尝试使用pyenchant拼写检查英语和保加利亚语文本。我有一个问题,在英语中,单词在小写和以大写字母开头时都被识别。例如:
>>> d = Dict('en_GB')
>>> d.check('car')
True
>>> d.check('Car')
True
然而,保加利亚语:
>>> d = Dict('bg_BG')
>>> d.check('кола')
True
>>> d.check('Кола')
False
这是正常行为吗?我想使用SpellChecker类来检查整个段落,这会妨碍我。我真的不想在整个str上使用.lower()
,因为这看起来像是一个黑客。
我正在使用pyenchant==1.6.8
和Python 3.5.2。 en_US和en_GB词典带有pyenchant,我分别从https://cgit.freedesktop.org/libreoffice/dictionaries/plain/bg_BG/bg_BG.dic
和aff下载了bg_BG字典。我不得不将它们从Windows-1251转换为UTF-8,因为否则无法识别任何单词。