OpenNLP NameFinder培训,"发现意外注释"

时间:2013-11-20 00:15:05

标签: opennlp named-entity-recognition training-data

在训练我的NameFinderME时,收到以下错误消息:

我的数据如下: <START someTag> some text <END>

Computing event counts... java.io.IOException: Found unexpected annotation:

在Google发现此错误消息的所有其他内容中,训练数据的间距始终是一个简单错误(例如,将<START:entity>some text<END>更改为<START:entity> some text <END>。这不适用于我(它都是正确间隔的。)它都是UTF-16,当我设置对象进行训练时指定是这样。任何关于可能出错的想法?​​

谢谢,

WalrusTheCat

2 个答案:

答案 0 :(得分:4)

数据不正确。而不是<START someTag>我需要<START:someTag>。我使用的是空格而不是冒号。

答案 1 :(得分:0)

另外,当发生这样的问题时,请确保您的和标签被空格包围,因此请使用Next person, <START:person>Rahul Vashishth<END>, is 61 years old.代替Next person, <START:person> Rahul Vashishth <END>, is 61 years old.