如何使用地名词典或词典作为CRF++中的功能?
详细说明:假设我想在人名上做NER,并且我有一个包含常见人名的地名词典(或字典),我想用这个地名词典作为crf ++的输入,我该怎么做?
我使用条件随机字段包crf ++来执行命名实体识别任务。 我知道如何在crf ++中表示一些常用的功能。例如,如果我们想使用Capitalization作为特征,我们可以在crf的特征模板中添加一个单独的列,指示单词是否大写。
答案 0 :(得分:6)
您可以创建一个新功能,指示令牌是否在词典/ gazeteer中。只需检查集合成员资格并将Gazeteer功能设置为1或0。