标签: python nlp wordnet
我被赋予了WSD(词义消除歧义)任务。我相信您要尝试的第一件事如下:
1)最常感知的基线(选择第一个同义词集#1)
2)简化的Lesk算法
不足为奇的是,最常识基线的性能表现相当不错,而简化的Lesk算法则不那么理想。使用此观察,我想知道您是否可以以某种方式在Simplified Lesk算法中纳入感官频率。如果Lesk算法在重叠大小上取最大值,那么,如果我们以某种方式给定了一定的感官频率(可能是从训练语料库中学到的),那么将重叠大小和相应感官频率的乘积最大值当作合理的修改?