使用机器学习简化文本

时间:2012-07-08 03:36:06

标签: java parsing machine-learning nlp stanford-nlp

我正在通过一个关于文本简化的项目,有几个开源提供了诸如斯坦福解析器之类的文本解析器。想知道是否有任何解析器能够使用机器学习解析文本!

1 个答案:

答案 0 :(得分:1)

OpenNLP是一个非常好的开源库。您可以使用许多特定的机器学习算法(例如MaxEnt)训练​​此库以生成特定于您的需求的模型。您还可以看到此discussion

虽然OpenNLP使用Apache许可证,但还有另一个名为LingPipe的工具,它也提供类似的功能但许可证不同。

Mahout也是一个很好的机器学习库,但是,您需要使用其他解析器或您自己的实现从文本中提取功能。 Mahout需要学习的功能。

教程: 1. OpenNLP Tutorials 2. LingPipe Tutorials