在为我的Lucene查询构建一些单元测试时,我注意到一些与标点符号相关的奇怪行为,特别是在括号周围。
处理包含大量标点符号的搜索字段有哪些最佳方法?
答案 0 :(得分:3)
如果您尚未自定义查询解析器,Lucene应根据default query parser syntax进行操作。你得到的东西不同吗?您是否希望标点符号具有特殊含义或仅删除搜索中的标点符号? 另一个常见的疑问是Analyzer,它决定了你的字段的索引方式以及如何将查询分成多个部分进行搜索。你能发布不良行为的具体例子吗?
答案 1 :(得分:1)
它不仅仅是括号,其他标点如冒号,连字符等都会引起问题。 Here是一种处理它们的方式。