我正在使用 GATE * SDK *,并希望将默认 ANNIE Gazetteer 修改为包含一个基于我创建的新列表定义的简单注释。
是否可以自动制作,所以我不需要训练ANNIE?所以我可以用语法编写吗?
答案 0 :(得分:2)
默认情况下,地名词典会使用Lookup
和majorType
功能创建minorType
类型的注释,例如<{p>}文件中的条目
.def
对于列表中的条目,将为oss.lst:software:open_source
“软件”和majorType
“open_source”创建查找。通常的方法是编写处理minorType
注释的JAPE规则并创建最终注释。
通过向Lookup
行添加更多字段,可以直接从地名词典创建其他注释类型:
.def
将创建类型为oss.lst:software:open_source::Software
而不是Software
的注释(字段为列表文件名,主要类型,次要类型,语言和注释类型)。但通常我建议坚持使用Lookup
,然后使用JAPE创建最终注释,这样您就可以根据需要添加其他规则(地名词典盲目地注释列表中任何内容的任何提及,您经常需要启发式来过滤这个例如,“Apache”在大多数情况下可能被认为是软件,但在“许可证”一词后面则不是。
最后,如果您想添加自己的地名词典列表和/或JAPE规则,我们建议您不要直接编辑Lookup
下的文件。而是在其他地方创建拥有 plugins/ANNIE
,然后将其加载到地理信息系统PR的单独实例中,插入管道中的适当位置。