OpenNLP能否从内容中提取关键字? 如果有,怎么样? 如果不是,我应该使用哪种工具?
我想自动标记内容。 例如。
杰西卡·查斯坦(Jessica Chastain)透露,已经与Marvel举行了一次会议,其中有一个未公开的角色,尽管这位明星证实这不是Marvel上尉。 “我们谈到了未来调整我们的力量,”查斯坦告诉MTV她与工作室的关系。 “这就是我的事......如果你要参加一部超级英雄电影,那你只有一次机会。” “你永远是那个角色。那么为什么要制作一部超级英雄的电影并扮演无聊的平民?“有可能参考Maya Hansen吗?查斯坦因为调度困难而最终辍学之前已经附加在钢铁侠3角色上了... “我不想说太多,”这位明星继续说道,“但有一件事,这个角色的未来有可能成为......而我就像,'我理解,但我想做它现在!'“ 尽管Chastain已经开始扼杀随后有关扮演Marvel船长的谣言,但是这个角色可能是谁的解释。
它应该被标记为“超级英雄”,“电影”。
OpenNLP能够做到这一点吗? 感谢。
答案 0 :(得分:1)
OpenNLP能够为您提取命名实体。这意味着任何人,地点,组织等的名称都可能被系统识别。
但是,您要寻找的是关键字提取,您要在其中识别一般意义上解释文档的相关关键字。我建议您查看Alchemyapi.com 他们有模型来提取关键字,分类,命名实体等。唯一的问题是免费版本每天只为您提供1000笔交易(这可能足以完成您的任务)