如何使用stanford解析器java在更短的时间内解析大文件

时间:2013-09-13 06:42:02

标签: java nlp text-parsing stanford-nlp

我需要解析使用斯坦福解析的数百个大文件,当我解析20个文件需要花费2个小时来解析时,有没有办法在更短的时间内完成这个。

下面是我解析单个文件的代码

TreebankLanguagePack tlp = new PennTreebankLanguagePack();
GrammaticalStructureFactory gsf = tlp.grammaticalStructureFactory();

for (List<HasWord> sentence : new DocumentPreprocessor("C://sample.txt")) {
    Tree parse = lp.apply(sentence);
    GrammaticalStructure gs = gsf.newGrammaticalStructure(parse);
    Collection tdl = gs.typedDependenciesCCprocessed();

    pw.print(parse.pennString());
    pw.println(tdl.toString());

}

由于

0 个答案:

没有答案