Apache OpenNLP:如何实现基于字典的实体识别?

时间:2013-07-21 19:51:46

标签: apache opennlp

我已经将jar文件下载到eclipse。

http://opennlp.apache.org/documentation/1.5.3/apidocs/opennlp-tools/index.html

如何执行以下操作:

1。)能够添加自己的名称和标签。 2.)能够获取字典中的名称和标签。 3.)在区分大小写和不区分大小写之间进行配置。

例如,假设我添加名称为“作者”的名称“Mike Smith”。

如果我的文字具有该名称,则应该能够识别出其中的标记。

请提供实际的java代码!!!

1 个答案:

答案 0 :(得分:0)

我在这里问了一个非常相似的问题:

Is it possible to conduct 'Context Analysis' for precise entity extraction with OpenNLP?

一般的共识是它的2个步骤,首先要确定你的句子是否包含作者,第二个找到名字。

我也想在一步中完成它(对语料库的分析包括其中的单词作为确定名称上下文的方法)