困惑的Lucene StringField

时间:2013-05-09 04:56:33

标签: search lucene document

我想从索引中创建一些文件,然后将它们放在另一个索引中。但我无法在“另一个索引”中检索这些文档 哦,这些文件只有StringField .. ..someboy可以帮助我

代码:

public static void test() throws IOException{
    IndexWriterConfig conf=new IndexWriterConfig(Version.LUCENE_43, new MapbarAnalyzer(TokenizerModle.COMMON));
    conf.setOpenMode(OpenMode.CREATE);
    conf.setMaxBufferedDocs(10000);
    LogByteSizeMergePolicy policy=new LogByteSizeMergePolicy();
    policy.setNoCFSRatio(1.0);
    policy.setUseCompoundFile(true);
    conf.setMergePolicy(policy);
    Directory d=new RAMDirectory();
    IndexWriter iw=new IndexWriter(d, conf);
    Document doc=new Document();
    doc.add(new StringField("type", "5B0", Store.YES));
    iw.addDocument(doc);
    iw.close();

    IndexReader r=DirectoryReader.open(d);
    IndexSearcher is=new IndexSearcher(r);
    Query q=new TermQuery(new Term("type","5B0"));
    TopDocs docs=is.search(q, 10);
    System.out.println(docs.totalHits);



    Directory d1=new RAMDirectory();
    IndexWriter iw1=new IndexWriter(d1, conf);
    int maxdoc=r.maxDoc();
    for(int i=0;i<maxdoc;i++){
        Document doc0=r.document(i);
        iw1.addDocument(doc0);
    }
    iw1.close();
    IndexReader r1=DirectoryReader.open(d1);
    IndexSearcher is1=new IndexSearcher(r1);
    Query q1=new TermQuery(new Term("type","5B0"));
    TopDocs docs1=is1.search(q1, 10);
    System.out.println(docs1.totalHits);


}

1 个答案:

答案 0 :(得分:0)

您可以尝试比较这两个索引/文档/查询之间的差异 事实证明,doc0的字段设置了“tokenized”属性。

更改代码如下:

for(int i=0;i<maxdoc;i++){
    Document doc0=r.document(i);
    Field f1 = (Field) doc0.getField("type");
    f1.fieldType().setTokenized(false);
    iw1.addDocument(doc0);
}

你可以从另一个索引获得结果。

但我不知道为什么FieldType从InderReader改变了......