WordNet字频率使用

时间:2013-03-31 23:59:58

标签: nlp wordnet word-frequency

是否有可能以wordnet或任何其他方式知道哪个词最常用。对于例如“商品”这个词可能更多地用于善意,而不是用于“产品”。或者,“key”这个词更多地用于指代真正的密钥而不是“解决方案”。例如这个问题的关键是......

有这样的东西??

1 个答案:

答案 0 :(得分:0)

词频有几个问题。表面单词频率只会告诉您单词在语料库中出现的次数。

然而,为了找到感觉频率,它仍然是未标记的语料库中未解决的问题。 (即某个语境中某个单词指某种意义的次数是多少?)。现在最好的办法是:

  1. 从感知标记语料库中计算感知频率,然后假设未标记语料库上的感知频率相似或
  2. 使用Word Sense Disambiguation软件标记未标记的语料库,然后计算标记产品的感知频率。然而,这是一种复杂的方法,因为大多数WSD软件仅使用来自已经标记的语料库的最常用感(MFS)。