我希望找到一份可下载(免费或付费)的英语词典,最好是来自牛津,剑桥,韦伯斯特的文本或XML格式,以便做一些NLP。
我希望每个条目都有
,例如在以下页面http://www.merriam-webster.com/dictionary/side。
定义的实际文本并不重要。我最需要的是词性,发音,形态,定义条目的顺序。
还想知道:当它进行POS标记时,Stanford NLP工具包用作词汇资源是什么?
谢谢。
答案 0 :(得分:2)
形态词典可以在FreeLing发行版中找到 - 请参阅data / en / dicc.src。顺便说一下,还有感官和语音词典。
关于Stanford POS标记:他们使用Penn treebank,proof