我使用 StandardAnalyzer 创建Lucene 3.0.3索引。
当使用 C , C#或 C ++ 等查询对索引进行搜索时,它会为所有这三个术语提供相同的结果。因为,我知道创建索引分析器时会忽略特殊字符而不会为其创建索引。
需要能够区分“C”,“C#”和“C ++”
请建议我,现有的分析仪是否会解决此问题?
任何建议都将不胜感激!!!
答案 0 :(得分:2)
我想这是因为StandardAnalyzer使用StandardFilter,它使用StandardTokenizer删除特殊字符。
您可以创建自己的Analyzer实现。
答案 1 :(得分:0)