使用(NLP)GAM工具为命名实体

时间:2011-05-14 16:40:02

标签: nlp gate

我可以在我的java程序中使用GATE http://gate.ac.uk/来提取命名实体。如果是的话,你能举一些例子或指导我参考吗?谢谢

2 个答案:

答案 0 :(得分:5)

您的问题实际上有两个问题:如何使用GATE查找命名实体,以及如何将GATE嵌入到您的应用程序中。

命名实体识别或分类是一个巨大的研究领域,根据您想要找到的命名实体,不同的方法可能是最有效的。 GATE提供了一个非常基本的地名词典列表和基于规则的方法,用于在英文文本中查找某些类别的命名实体:ANNIE。 如果ANNIE找到的类别是您感兴趣的类别,那么启动的一种方法可能是理解和改进ANNIE已经提供的内容。 ANNIE管道将在您的文档中为Person,Organization等创建注释,您只需要使用或编写访问这些注释的PR,并使用这些注释的功能或文本执行您需要的任何操作。 查看GATE手册http://gate.ac.uk/sale/tao/split.html它解释了ANNIE,还有一些关于如何嵌入GATE的文档(如何在不运行GUI的情况下直接从Java程序中使用GATE)。

答案 1 :(得分:-2)

以下是一些可用于命名实体识别的CREOLE插件列表NER:

  • Tagger_Measurement
  • Tagger_Number

如果您对医疗NER感兴趣,可以使用:

  • Tagger_MetaMap:查找疾病,综合症,程序等医疗实体

还有这些外部插件: