我有两个hunspell格式的文件(.dic和.aff)用于乌克兰语。我的程序必须得到输入单词的基本形式。因此,它可以使用.dic文件中的单词形式和.aff文件中的附件。我甚至不知道如何使用Hunspell util实现这一点,但假设它是可能的。
哪些python库可以使用.dic和.aff文件获得单词的基本形式?
答案 0 :(得分:2)
如前所述,hunspell是您需要的库。 https://code.google.com/p/pyhunspell/wiki/UsingPyHunspell的示例:
import hunspell
hobj = hunspell.HunSpell('/usr/share/myspell/en_US.dic', '/usr/share/myspell/en_US.aff')
hobj.spell('spookie')
>>>>False
hobj.suggest('spookie')
>>>>['spookier', 'spookiness', 'spooky', 'spook', 'spoonbill']
hobj.spell('spooky')
>>>>True
hobj.analyze('linked')
>>>>[' st:link fl:D']
hobj.stem('linked')
>>>>['link']
答案 1 :(得分:0)
只是更新说le pyhunspell项目不再是googlecode。 以下是新链接:
关于添加功能(在第一个回答的评论中提到),它现在记录在pydoc中。