如何使用python将字符串标记为IOB注释?

时间:2019-02-26 20:01:34

标签: python nlp data-annotations

我有一个数据帧,其中包含我需要根据IOB注释标记的单词/短语的字符的开始索引和结束索引。

段:

   start  end         keyword
0      4   10          voices
1     12   26  hallucinations 

和一行:Any voices, hallucinations ? [SEP] No.

示例输出:

O B-seg B-seg O

由于这是IOB标记,因此开始索引和结束索引之间的第一个单词应为“ B-seg”,而介于两者之间的其他单词应为“ I-seg”。句子中的所有其他单词应为“ O”。您可以参考上面的示例输出。

我该如何在python中做到这一点?

0 个答案:

没有答案