我正在尝试实施搬运工干扰算法,但我对这一点有了难度
步骤1c
(*v*) Y -> I happy -> happi sky -> sky
这不是我们想要做的事情的反面,为什么算法会将Y转换为I.
此处为完整算法http://tartarus.org/~martin/PorterStemmer/def.txt
由于
答案 0 :(得分:2)
Porter词干和其他stemming algorithms并不总是返回单词;他们返回word stems。目标是相关的词应该具有相同的词干。只要“快乐”,“快乐”和“快乐”都减少到同一个词干,那么即使词干不是真正的词,你的词干也会正常工作。