我正在学习GATE和JAPE语法。这是我第一次使用GATE和JAPE语法。我正在关注this教程,其中给出了识别运动的语法。我使用了这个.jape
文件和示例文本,但GATE无法识别除人员,组织,日期等之外的任何内容。
我想知道如何在GATE中使用自定义.jape
语法?如果有人可以请给出步骤,那么它会非常棒。
目前我正在执行以下步骤:
启动GATE GUI。
加载带有默认值的ANNIE系统。
步骤(2)在Processing Resources
下加载ANNIE POS Tagger,标记器,句子分割器等。
右键点击Processing Resources
并选择New -> JAPE Transducer
。
提供.jape
文件的路径并给出一些名称。
右键点击Language Resources
,然后选择New -> GATE Corpus
。
给语料库命名。
右键点击新创建的语料库,然后选择Populate
。
选择存在文本文件的目录。我们想跑 关于这些文件的门。
双击ANNIE
节点下的Applications
,然后点击Run
This Application
按钮。
点击Run This Application
按钮后,所有处理完成后,我打开输入文本文件。
此文件没有在.jape
文件中写入的任何标记,它只显示正常标记,如人物,组织等。
我的.jape
文件如下所示:
Phase:firstpass
Input: Lookup
Options: control = brill
Rule: SportsCategory
Priority: 20
(
{Lookup.majorType == "Sports"}
): label
-->
:label.Sport = {rule= "SportsCategory" }
和输入文本文件如下:
Soccer - Rooney Gerrard - File .
Composite file picture of Liverpool 's Steven Gerrard (left , dated 27 September 2006 ) and Manchester United 's Wayne Rooney (dated 20 August 2006 ) . On the occasion of his 21st Birthday , Tuesday 24 October 2006 , Wayne Rooney has hailed England team -mate Steven Gerrard as one of the world 's best midfielders and wishes the Liverpool star could play at Manchester United .
任何人都可以告诉我,如果我错过任何其他步骤。我无法找到一步一步的说明:(我希望GATE的人会花一些时间写这样的教程。
答案 0 :(得分:4)
您的规则未被触发,因为在带注释的文档中没有主要类型Sports的查找。
除非你在默认的ANNIE应用程序中添加了一些东西,否则我只是打开它,看到在默认的地名词典中只有一个带有majorType运动的文件,它包含网球,游泳等等没有足球的东西。如果你使用的是基于规则的系统,你最终可能会添加很多字典:)
一个好的做法是创建一个简单的测试文档并运行您的管道直到jape规则(之后停止或排除所有PR),然后检查文档是否满足LHS先决条件。在你的情况下,应该有一个使用majorType体育的Lookup。
我认为最好的jape一步一步教程可以在this training material中找到。但你明白了。