特殊字符索引

时间:2011-03-10 14:07:47

标签: special-characters lucene

我使用 StandardAnalyzer 创建Lucene 3.0.3索引。

当使用 C C# C ++ 等查询对索引进行搜索时,它会为所有这三个术语提供相同的结果。因为,我知道创建索引分析器时会忽略特殊字符而不会为其创建索引。

需要能够区分“C”,“C#”和“C ++”

请建议我,现有的分析仪是否会解决此问题?

任何建议都将不胜感激!!!

2 个答案:

答案 0 :(得分:2)

我想这是因为StandardAnalyzer使用StandardFilter,它使用StandardTokenizer删除特殊字符。
您可以创建自己的Analyzer实现。

答案 1 :(得分:0)