我是使用Weka的新手。我已经建立了一个使用c#解决代词回指的程序,但是现在我想使用Weka进行相同的操作,然后将两者进行比较。
我不确定如何为案件建模。我需要使用单词语法标签(名词,动词,代词等),还要考虑单词的数量和性别。在我的C#程序中解决共指时,我还考虑了代词到名词的距离。
我的问题是:
如何使用Weka表示单词?考虑到我必须代表它是否是一个动词,一个名词,它们有多少数字和性别等等。
应该如何在@data
上表示每个已解决的共同参照个案以进行培训?像这样吗(请使用不正确的Weka语法,它只是伪代码)
@data
word1{proper noun, singular, feminine}, word2{verb}, word3{pronoun, singular, feminine}, solution{word3, word1, distance:2}
是否有任何文档/示例/使用Weka进行共指解析?