我可以在我的java程序中使用GATE http://gate.ac.uk/来提取命名实体。如果是的话,你能举一些例子或指导我参考吗?谢谢
答案 0 :(得分:5)
您的问题实际上有两个问题:如何使用GATE查找命名实体,以及如何将GATE嵌入到您的应用程序中。
命名实体识别或分类是一个巨大的研究领域,根据您想要找到的命名实体,不同的方法可能是最有效的。 GATE提供了一个非常基本的地名词典列表和基于规则的方法,用于在英文文本中查找某些类别的命名实体:ANNIE。 如果ANNIE找到的类别是您感兴趣的类别,那么启动的一种方法可能是理解和改进ANNIE已经提供的内容。 ANNIE管道将在您的文档中为Person,Organization等创建注释,您只需要使用或编写访问这些注释的PR,并使用这些注释的功能或文本执行您需要的任何操作。 查看GATE手册http://gate.ac.uk/sale/tao/split.html它解释了ANNIE,还有一些关于如何嵌入GATE的文档(如何在不运行GUI的情况下直接从Java程序中使用GATE)。
答案 1 :(得分:-2)
以下是一些可用于命名实体识别的CREOLE插件列表NER:
如果您对医疗NER感兴趣,可以使用:
还有这些外部插件: