我在Python中编写了一个原型,使用NLTK
包来执行3个NLP任务:
我现在需要将其移植到Java中,并且正在寻找3个任务的现有实现。
对于#1的基本表单转换子任务,我希望能够提供专门的字典,以帮助更好地处理来自我正在处理的专用域的文本。但如果这不可行,那么使用任何默认值都可以。
表现很重要。 python版本是原型,但Java端口必须在生产中工作。主要要求是在大量数据的速度方面的可扩展性。 prod机器有很多RAM,因此不太关心。
有什么建议吗?我可以使用CoreNLP
或OpenNLP
作为#1但是#2和3呢?