如何使用WEKA查找带有监督的方法的关键短语。
我必须学习关键短语提取的模型,所以我有一个培训语料库(每个文档都有一个包含关键短语或关键字的相应文件)
我还有一个用于测试监督模型的语料库(没有关键短语文件的文档),因此模型应输出每个文档的关键短语列表。
我的问题是如何将文档输入weka,我应该为每个文档添加
@attribute doc string
@data “Docu1 ............” “Docu2 ............” ... .. “DocuN ............”
现在如何输入包含每个文档的关键短语的文件,以便从模型中学习?