我想将一个语料库中的文档添加到另一个语料库或合并两个语料库。 我怎么能这样做?
答案 0 :(得分:2)
好。我从here找到了这个答案。
for(int i = 0; i < corpus2.size(); i++) {
Document doc = corpus2.get(i);
// remove corpus2's reference to loaded doc, but don't sync
corpus2.unloadDocument(i, false);
// "un-adopt" doc from old datastore
doc.setDataStore(null);
doc.setLRPersistenceId(null);
// and save it into the new one
luceneDataStore.adopt(doc);
luceneDataStore.sync(doc);
// add to the corpus
corpus1.add(doc);
// now we can unload properly
corpus1.unloadDocument(doc);
Factory.deleteResource(doc);
}
luceneDataStore.sync(corpus1);
非常感谢。