Wordnet(Word Sense Annotated)语料库

时间:2012-01-11 16:19:24

标签: nlp wordnet corpus tagged-corpus

我一直在使用许多不同的语料库进行自然语言处理,我一直在寻找一个用Wordnet Word Senses注释的语料库。

据我所知,这些信息可能没有大的语料库,因为语料库需要手动构建,但必须有一些东西可以解决。

此外,如果不存在语料库,是否至少有一个带注释的ngram数据库(每个词定义的每个百分比,或每个wordnet定义的数字计数取决于多么常见)感觉这个词是?)

3 个答案:

答案 0 :(得分:8)

为WordNet注释的三个着名语料库:

答案 1 :(得分:1)

部分SENSEVAL(现在SEMEVAL)数据已使用WordNet进行注释。

答案 2 :(得分:0)

你可以使用senseval2,对于java有一个semcor格式和(jSemcor API) 还有senseval3。 这两个语料库用于词义消歧。