我一直在使用许多不同的语料库进行自然语言处理,我一直在寻找一个用Wordnet Word Senses注释的语料库。
据我所知,这些信息可能没有大的语料库,因为语料库需要手动构建,但必须有一些东西可以解决。
此外,如果不存在语料库,是否至少有一个带注释的ngram数据库(每个词定义的每个百分比,或每个wordnet定义的数字计数取决于多么常见)感觉这个词是?)
答案 0 :(得分:8)
为WordNet注释的三个着名语料库:
答案 1 :(得分:1)
答案 2 :(得分:0)
你可以使用senseval2,对于java有一个semcor格式和(jSemcor API) 还有senseval3。 这两个语料库用于词义消歧。