我试图用Lucene 4.7索引一些长文本,我认为一切都很好,但我发现我的搜索命中率并不完整。
经过长时间的搜索,我找到了一个网页,上面写着“当我尝试索引Lucene中的长文本时,Lucene只索引前n个字符以防止堆栈溢出。”
我想索引全文,我不知道该怎么做¿有些请问?这是我的代码:
File indexDir = new File(indexPath);
Directory directory = FSDirectory.open(indexDir);
IndexWriterConfig config = new IndexWriterConfig(Version.LUCENE_47, analyzer);
config.setOpenMode(IndexWriterConfig.OpenMode.CREATE);
writer = new IndexWriter(directory, config);
Document doc = new Document();
doc.add(new DoubleField("textID", textID, Field.Store.YES));
doc.add(new TextField("text", text, Field.Store.NO));
doc.add(new TextField("title", title, Field.Store.NO));
doc.add(new StringField("discourse", discourse, StringField.Store.YES));
writer.addDocument(doc);