具有NLP应用程序的语义角色标记的语料库

时间:2011-08-02 22:14:20

标签: nlp semantic-markup corpus tagged-corpus

所以,我构建了一个NLP程序,学习从句子中提取语义事件描述,但是现在我的训练集仅限于我已经解析成语义事件组件的句子。

虽然这种方法确实完成了工作,但它几乎不能替代大量预先解析的文本语料库。不幸的是,我发现这种语料库的所有尝试都被证明是徒劳的。

我特别需要的是一个语料库,它在一个句子中标记了每个单词(或一组单词)的语义角色。我想到的角色的例子是:

  • 动作
  • 患者
  • 仪器
  • 助剂
  • 共患者
  • 位置
  • 副词

如果需要更多细节,请随意询问,或参考使用与我的约束相同的玩具corpa的this paper

1 个答案:

答案 0 :(得分:2)

2005年的CoNLL共享任务是“语义角色标记”。 This page描述了他们的语料库以及他们标记的角色。