我正在使用Alex Shyba的高级数据库爬虫来索引来自Sitecore和Lucene.NET查询的数据以进行搜索查询。我大部分时间都在努力工作,但是当我尝试进行术语匹配时遇到问题,例如en-US,zh-CN和de-DE。
它返回'en'文化的所有结果。但是,例如在zh-CN文化中,它返回了大约99%的结果,并且从每组中留下2-3篇文章。 en和zh-CN是同一项目的不同版本。我可以通过Luke看到索引中两种文化中的项目信息。
我在语言字段上使用TermQuery来返回数据。我尝试使用PhraseQuery和WildCardQuery,但每次我得到相同的结果。
我试图逃避连字符,因为标准分析器不喜欢带有反斜杠的大肆宣传,但这也不起作用。
此时我没有想法。如何让我的查询返回所有匹配的文档?
由于