什么是Word-Sense-Disambiguation的最佳算法

时间:2012-02-20 02:25:02

标签: python nlp nltk text-processing

Word-Sense-Disambiguation的最佳算法是什么

我阅读了很多帖子,每个人都在研究文档中证明特定算法是最好的,这非常令人困惑。

我只想出2个实现1-Lesk算法已被弃用,2-Adapted Lesk很好但不是最好的

如果基于他(经验)的任何人知道任何其他优秀的算法,准确度高达70%或更高,请提及它。如果有算法的任何伪代码的链接,它会很棒,我会尝试用Python或Java实现它。

2 个答案:

答案 0 :(得分:1)

嗯,WSD是一个开放的问题(因为它的语言......和AI ......),所以目前每个声明在某种意义上都是有效的。如果您从事特定领域的项目,我认为如果您能找到合适的语料库,最好使用统计方法(支持向量机)。就个人而言,如果您正在使用python,除非您尝试进行一些重要的原创性研究,我认为您应该使用NLTK模块来完成您想要做的任何事情。

答案 1 :(得分:1)

这个问题太模糊了,“一般”没有最好的算法:这将取决于你的问题,你的数据等。

我可以建议阅读一些有关自然语言处理(NLP)的书籍