高效的Lemmatizer,避免字典查找

时间:2011-12-12 06:14:32

标签: java relevance text-analysis lemmatization

我想将'eat'之类的字符串转换为'eat','吃'。我搜索并发现了词形还原作为解决方案,但我遇到的所有lemmatizer工具都使用wordlist或字典查找。是否存在避免字典查找并提供高效率的词形变换器,可能是基于规则的词形变换器。是的,我不是在寻找“干扰者”。

1 个答案:

答案 0 :(得分:1)

您可以尝试LRBL:基于规则的变形器

它使用递归缩写词的概念。