如何使用GATE嵌入式的Stanford解析器(通过Java代码使用GATE)。我目前在我的机器上使用GATE_Developer_7.0;我知道在GATE中有Stanford Parser的插件,但不知道如何使用java代码来使用它。
由于
答案 0 :(得分:1)
我们一直推荐的GATE Embedded常用方法是使用GATE Developer构建管道,测试它并通过在GUI中处理样本文档来调试它。一旦您对应用程序感到满意,请使用“保存应用程序状态”或“导出GATECloud.net”来生成已保存的状态,然后您可以使用PersistenceManager
加载嵌入式代码。这将自动确保加载所有必需的插件,并且通常比在代码中手动构建管道更简单且更不容易出错。
GATE网站上的BatchProcessApp example显示了如何使用PersistenceManager加载已保存的应用程序,基本上是
Gate.init(); // always the first thing you do
CorpusController controller = (CorpusController)PersistenceManager
.loadObjectFromFile(new File("/path/to/application.xgapp"));
Corpus corpus = Factory.newCorpus("myCorpus");
controller.setCorpus(corpus);
然后为您要处理的每个文档
Document doc = Factory.newDocument(....);
corpus.add(doc);
try {
controller.execute();
// code here to do stuff with the annotated document, e.g. extract
// annotations/features
} finally {
corpus.clear();
Factory.deleteResource(doc);
}