如何向默认的ANNIE gazetteer添加自定义注释?

时间:2014-02-11 19:52:25

标签: nlp gate

我正在使用 GATE * SDK *,并希望将默认 ANNIE Gazetteer 修改为包含一个基于我创建的新列表定义的简单注释。

  • 我已将我的列表定义添加到 GATE-HOME \ plugins \ ANNIE \ resources \ gazetteer
  • 我在lists.def文件中添加了一个条目,指向我的新列表文件。例如。 * open_source_software:opensouce *
  • 我创建了一个注释架构并添加到GATE-HOME \ plugins \ ANNIE \ resources \ schema
  • 当我加载ANNIE并运行应用程序时,它不会自动识别注释但是当我将鼠标悬停在新列表定义中存在的单词时,ANNIE会突出显示该单词并建议正确的注释

是否可以自动制作,所以我不需要训练ANNIE?所以我可以用语法编写吗?

1 个答案:

答案 0 :(得分:2)

默认情况下,地名词典会使用LookupmajorType功能创建minorType类型的注释,例如<{p>}文件中的条目

.def
对于列表中的条目,

将为oss.lst:software:open_source “软件”和majorType“open_source”创建查找。通常的方法是编写处理minorType注释的JAPE规则并创建最终注释。

通过向Lookup行添加更多字段,可以直接从地名词典创建其他注释类型:

.def

将创建类型为oss.lst:software:open_source::Software 而不是Software的注释(字段为列表文件名,主要类型,次要类型,语言和注释类型)。但通常我建议坚持使用Lookup,然后使用JAPE创建最终注释,这样您就可以根据需要添加其他规则(地名词典盲目地注释列表中任何内容的任何提及,您经常需要启发式来过滤这个例如,“Apache”在大多数情况下可能被认为是软件,但在“许可证”一词后面则不是。

最后,如果您想添加自己的地名词典列表和/或JAPE规则,我们建议您不要直接编辑Lookup下的文件。而是在其他地方创建拥有 plugins/ANNIE,然后将其加载到地理信息系统PR的单独实例中,插入管道中的适当位置。