早上好,
我正在为我的应用程序使用斯坦福部分语音,我需要解析许多文本文件(可以转到20个文件)。但是我注意到stanford花了很多时间(有时30分钟或更长时间),问题是斯坦福自动构建语法树,即使我不需要它。 以前有人遇到过这个问题吗?我该怎么做才能减少斯坦福的解析时间?
欢迎任何帮助, 问候。
答案 0 :(得分:1)
如果你只想要词性,而不是解析树,你应该运行一个(序列模型)词性标记器,例如Stanford POS Tagger,这个数字要快几个数量级。请参阅Stanford Parser FAQ。 (如果您想要快速标记,请使用Stanford POS Tagger的left3words-wsj-0-18.tagger
模型。)