使用* .dic * .aff进行Python形态文本分析

时间:2014-06-07 15:18:41

标签: python hunspell morphological-analysis

我有两个hunspell格式的文件(.dic和.aff)用于乌克兰语。我的程序必须得到输入单词的基本形式。因此,它可以使用.dic文件中的单词形式和.aff文件中的附件。我甚至不知道如何使用Hunspell util实现这一点,但假设它是可能的。

哪些python库可以使用.dic和.aff文件获得单词的基本形式?

2 个答案:

答案 0 :(得分:2)

如前所述,hunspell是您需要的库。 https://code.google.com/p/pyhunspell/wiki/UsingPyHunspell的示例:

import hunspell
hobj = hunspell.HunSpell('/usr/share/myspell/en_US.dic', '/usr/share/myspell/en_US.aff')
hobj.spell('spookie')
>>>>False

hobj.suggest('spookie')
>>>>['spookier', 'spookiness', 'spooky', 'spook', 'spoonbill']

hobj.spell('spooky')
>>>>True

hobj.analyze('linked')
>>>>[' st:link fl:D']
hobj.stem('linked')
>>>>['link']

答案 1 :(得分:0)

只是更新说le pyhunspell项目不再是googlecode。 以下是新链接:

关于添加功能(在第一个回答的评论中提到),它现在记录在pydoc中。