NLP新手,关于注释的问题

时间:2010-11-30 03:36:00

标签: java annotations nlp

我是NLP的新手,我正在寻找一个起点,就一些教程,文档或示例代码而言。 我被告知要研究处理自然文本以从中提取一些结构化数据的可能性。 例如,我想从以下语句中提取(注释)高度和重量。 “他身高6英尺,重200磅”或者 “他的身高是6英尺,体重是200”等。 我已经研究过UIMA,但它似乎是一个自己创建的REGEX字典,没有培训功能。 简而言之,我可以使用什么Java框架来创建可以训练的注释引擎! 任何帮助(指针)将非常感谢。 感谢

3 个答案:

答案 0 :(得分:5)

由于您要求提供指针:LingPipe(已在上文中提及),OpenNLPStanford NLP distributions

注意:如果Python是一个选项,您可以使用Natural Language Toolkit

答案 1 :(得分:3)

如果您真的想要使用机器学习来训练注释器,那么GATE可能是您最好的选择。请查看指南中machine learning的章节。

答案 2 :(得分:0)

我会用NER。这是我在输入文本中看到的输出: enter image description here

你可以在这里试试: http://deagol.cs.illinois.edu:8080