可读格式的英文字典(文本或xml)

时间:2015-02-22 11:48:18

标签: nlp stanford-nlp

我希望找到一份可下载(免费或付费)的英语词典,最好是来自牛津,剑桥,韦伯斯特的文本或XML格式,以便做一些NLP。

我希望每个条目都有

  • 一个完整的演讲,
  • 发音,
  • 动词和名词的
  • 形态
  • 多个意义/定义条目

,例如在以下页面http://www.merriam-webster.com/dictionary/side

定义的实际文本并不重要。我最需要的是词性,发音,形态,定义条目的顺序。

还想知道:当它进行POS标记时,Stanford NLP工具包用作词汇资源是什么?

谢谢。

1 个答案:

答案 0 :(得分:2)

Herehere是类似的问题。总结:

  1. Part-of speech dictionary - 不幸的是,标签设置很窄。
  2. Pronouncing Dictionary
  3. 多重感官 - WordNet
  4. 形态词典可以在FreeLing发行版中找到 - 请参阅data / en / dicc.src。顺便说一下,还有感官和语音词典。

    关于Stanford POS标记:他们使用Penn treebankproof