我正在使用solr来实现搜索阿拉伯语网站,我希望将复数词正常化为单数词,反之亦然,所以搜索“كتاب”会得到任何包含“كتاب”或“كتب”的文件,这是可能的在solr中,非常感谢您的意见
答案 0 :(得分:1)
Ramzi Alqrainy在Lucene / Solr革命中介绍了Solr对阿拉伯语和常见问题的支持。现在是available online。
答案 1 :(得分:1)
你需要一个词干分析器在索引/搜索中将单词带入其原点,尝试Khoja's stemmer或Assem's stemmer
Solr默认使用a light stemmer for Arabic,但似乎你需要一个带有词根的深层词干。