如何减少斯坦福解析器的执行时间?

时间:2011-05-25 10:12:14

标签: java stanford-nlp

早上好,

我正在为我的应用程序使用斯坦福部分语音,我需要解析许多文本文件(可以转到20个文件)。但是我注意到stanford花了很多时间(有时30分钟或更长时间),问题是斯坦福自动构建语法树,即使我不需要它。 以前有人遇到过这个问题吗?我该怎么做才能减少斯坦福的解析时间?

欢迎任何帮助, 问候。

1 个答案:

答案 0 :(得分:1)

如果你只想要词性,而不是解析树,你应该运行一个(序列模型)词性标记器,例如Stanford POS Tagger,这个数字要快几个数量级。请参阅Stanford Parser FAQ。 (如果您想要快速标记,请使用Stanford POS Tagger的left3words-wsj-0-18.tagger模型。)