标签: java relevance text-analysis lemmatization
我想将'eat'之类的字符串转换为'eat','吃'。我搜索并发现了词形还原作为解决方案,但我遇到的所有lemmatizer工具都使用wordlist或字典查找。是否存在避免字典查找并提供高效率的词形变换器,可能是基于规则的词形变换器。是的,我不是在寻找“干扰者”。
答案 0 :(得分:1)
您可以尝试LRBL:基于规则的变形器
它使用递归缩写词的概念。