Lucene.NET索引一个字母的单词?

时间:2011-10-18 08:55:31

标签: c# .net lucene indexing

我正在使用Lucene.NET,当我尝试索引例如以下文字时:“在de categoriesie T zijn tijdelijke borden(zwarte tekst / symbolen op gele achtergrond)opgenomen die niet in永久性uitvoering beschikbaar zijn。“

以粗体显示文本,所有内容都被编入索引,但是T将被忽略。

有人知道这个问题/问题。我使用以下语法。

doc.Add(new Field("text", text, Field.Store.NO, Field.Index.TOKENIZED));

1 个答案:

答案 0 :(得分:0)

默认情况下,“T”是标准分析仪中的停用词。创建分析器时,您可以提供自己的停用词列表。

只需创建一个这样的分析器:

StandardAnalyzer standardAnalyzer = new StandardAnalyzer(new string[]{"an", "a", /*other stopwords*/});

在索引和搜索过程中使用它。