标签: lucene.net stemming
我即将启动Lucene.NET实现,我担心使用PorterStemFilter。在这里阅读,阅读源代码,对我的需求来说似乎有点过于激进。
PorterStemFilter
我需要更简单的东西,不寻找根但只是删除“呃”,“ed”,“s”等后缀。从我读过的内容来看,KStem会做到这一点。
我不能为我的生活找到一个.NET版本的KStem。我甚至找不到Java版本的源代码来处理端口。
有人能指出我正确的方向吗?
通过简单地删除我不想要的步骤,看起来很容易手工制作简化的PorterStemmer。任何人都有成功吗?
答案 0 :(得分:0)
你可以使用贡献的HunspellStemmer部分。它可以使用免费提供的hunspell词典来提供适当的词干。