我正在使用Lucene.NET,当我尝试索引例如以下文字时:“在de categoriesie T zijn tijdelijke borden(zwarte tekst / symbolen op gele achtergrond)opgenomen die niet in永久性uitvoering beschikbaar zijn。“
以粗体显示文本,所有内容都被编入索引,但是T将被忽略。
有人知道这个问题/问题。我使用以下语法。
doc.Add(new Field("text", text, Field.Store.NO, Field.Index.TOKENIZED));
答案 0 :(得分:0)
默认情况下,“T”是标准分析仪中的停用词。创建分析器时,您可以提供自己的停用词列表。
只需创建一个这样的分析器:
StandardAnalyzer standardAnalyzer = new StandardAnalyzer(new string[]{"an", "a", /*other stopwords*/});
在索引和搜索过程中使用它。