Lucene 4.7长文索引

时间:2014-03-24 20:55:16

标签: lucene indexing full-text-search longtext

我试图用Lucene 4.7索引一些长文本,我认为一切都很好,但我发现我的搜索命中率并不完整。

经过长时间的搜索,我找到了一个网页,上面写着“当我尝试索引Lucene中的长文本时,Lucene只索引前n个字符以防止堆栈溢出。”

我想索引全文,我不知道该怎么做¿有些请问?这是我的代码:

    File indexDir = new File(indexPath);
    Directory directory = FSDirectory.open(indexDir);
    IndexWriterConfig config = new IndexWriterConfig(Version.LUCENE_47, analyzer);
    config.setOpenMode(IndexWriterConfig.OpenMode.CREATE);
    writer = new IndexWriter(directory, config);
    Document doc = new Document();
    doc.add(new DoubleField("textID", textID, Field.Store.YES));
    doc.add(new TextField("text", text, Field.Store.NO));
    doc.add(new TextField("title", title, Field.Store.NO));
    doc.add(new StringField("discourse", discourse, StringField.Store.YES));
    writer.addDocument(doc);

0 个答案:

没有答案