我爱Stanford CoreNLP,现在它对我的NLP需求非常准确。问题在于分析大量文本(让我们说数百万句子)需要天。
是否有替代Java实现牺牲了一些准确性以提高效率,同时(理想情况下)提供相同的API?
答案 0 :(得分:5)
如果您使用的是PCFG或分解模型,您可以考虑切换到自3.2版以来可用的新RNN models - 它们要快得多。
或者,如果您只需要依赖项,则可以尝试其他解析器(例如mate-tools parser或ClearNLP dependency parser)。如果您需要成分,可以尝试Berkeley parser。
Afaik,没有其他解析器实现与Stanford Parser具有相同的API。但是,有些集合为不同的解析器提供了相当统一的API,例如DKPro Core或ClearTK。
披露:我是DKPro Core项目的开发人员。