我有一个训练DataSet和一个Test DataSet。我们如何实验并获得结果? WEKA可以用于同样的吗?
主题是使用支持向量机监督学习方法的Word Sense消歧
两个集合中的文档类型包括以下文件类型: 1. 2个XML文件 2.自述文件 3. SENSEMAP格式 4.火车格式 5. KEY格式 6.单词格式
答案 0 :(得分:2)
像SVM这样的机器学习方法在词义消歧方面并不受欢迎
你知道Wikify,映射到维基百科可以被认为是非常好的词义消歧
在这样的情况下回答你的问题;任何机器学习技术都可以给你想要的结果。人们应该更加担心要提取的功能,并确保单词功能足够独特,以解决您选择的级别的歧义。例如,在句子Wish you a very Happy Christamas
中,您只想将Happy Christmas
歧义为书籍或节日。