在使用BIO块训练NER时,在下列情况下最合适的方法是什么?

时间:2017-05-12 06:04:56

标签: nlp stanford-nlp

在我的情况下,我想在DISEASE和SYMPTOM标签下标记以下内容

例如:Osgood-Schlatter病是胫骨上部疼痛的炎症。

我已成功训练为Osgood-Schlatter/b-disease disease/i-disease(我使用了BIO NER标记方法)

但是我不确定将剩余部分"胫骨上部的疼痛性炎症标记为> 是否正确为症状本身是否正确。

painful/b-symptom inflammation/i-symptom of/i-symptom the/i-symptom upper/i-symptom portion/i-symptom of/i-symptom the/i-symptom tibia/i-symptom

我想知道是否使用我当前的方法,还是应该遵循基于POS标签的解析方法或任何其他合适的方法?

1 个答案:

答案 0 :(得分:0)

对于金融领域的类似用例,我用这种方法得到了相当不错的结果。 但我也使用了POS标签和distsim方法来训练模型。 这样您就可以提供更多可供学习的功能。