什么代表了Word Sense Disambiguation(WSD)软件的最新技术?哪些指标决定了最新技术,哪些工具包/开源软件包可用?
答案 0 :(得分:12)
我的列表并非详尽无遗,但谷歌搜索更多内容将更适合您的目的。
对于软件,这里有一个简短的清单,记得 CITE 相关来源!!!
GWSD:无监督的基于图表的词义消歧 http://lit.csci.unt.edu/~rada/downloads/GWSD/GWSD.1.0.tar.gz
SenseLearner:All-Words Word Sense Diskeyiguation Tool http://lit.csci.unt.edu/~rada/downloads/senselearner/SenseLearner2.0.tar.gz
KYOTO UKB基于图表的WSD http://ixa2.si.ehu.es/ukb/
pyWSD:简单WSD算法的Python实现 https://github.com/alvations/pywsd
WSD任务也有点依赖于数据源,所以这里有一些,记得 CITE 也是这样!!!
开放思维Word专家感知标记数据 http://teach-computers.org/word-expert.html
TWA Sense标记数据 http://lit.csci.unt.edu/~rada/downloads/TWA/TWA.tar.gz
<强> SemCor 强> http://lit.csci.unt.edu/~rada/downloads/semcor/semcor1.6.tar.gz
最后,WSD任务依赖于一些预处理,如果您正在研究最先进的跨语言WSD,那么您应该尝试寻找像
这样的字级别对齐器。另外,查看之前的Senseval / SemEval页面以查找已完成的操作,以及未来任务正在朝着哪些趋势发展。 http://en.wikipedia.org/wiki/SemEval