使用WEKA的词义歧义消歧

时间:2014-11-11 18:42:30

标签: nlp weka svm supervised-learning wsd

我有一个训练DataSet和一个Test DataSet。我们如何实验并获得结果? WEKA可以用于同样的吗?

主题是使用支持向量机监督学习方法的Word Sense消歧

两个集合中的文档类型包括以下文件类型: 1. 2个XML文件 2.自述文件 3. SENSEMAP格式 4.火车格式 5. KEY格式 6.单词格式

1 个答案:

答案 0 :(得分:2)

像SVM这样的机器学习方法在词义消歧方面并不受欢迎 你知道Wikify,映射到维基百科可以被认为是非常好的词义消歧 在这样的情况下回答你的问题;任何机器学习技术都可以给你想要的结果。人们应该更加担心要提取的功能,并确保单词功能足够独特,以解决您选择的级别的歧义。例如,在句子Wish you a very Happy Christamas中,您只想将Happy Christmas歧义为书籍或节日。