我有训练数据(.arff),我想转换为测试数据。
这是我的训练数据:
@relation fix_labeled_tweet
@attribute Text string
@attribute class-att {relevant,not_relevant,additional}
@data
'pvj dengan ciwalk masih tetap jadi tempat fav untuk belanja;',additional
'deta di bandung trade centre btc fashion mall;',additional
'promo hotel bandung ibis trans studio enjoy our special price akan your wonderful weekend periode s di 27 desember;',not_relevant
'indri theressa di cihampelas walk ciwalk;',additional
'beiga we di jatinangor town square jatos;',additional
'nonton di paris van java my husband;',relevant
'mainya seringnya ke paris van java mall miko mall mana;',not_relevant
'double date yeahhhh di braga city walk;',relevant
'sinta di jatinangor town square jatos;',additional
'terimakasih tas dompet teguh di cihampelas walk ciwalk;',additional
'malam minggu miko the movie di cinema 21 mall panakukang;',additional
'karaokean sekalian dugem patriot handrian di inul vista paskal hypersquare;',relevant
'makan di mujigae korean resto ciwalk;',relevant
'just posted a photo bandung trade center;',additional
我尝试过的是从数据中删除标签(添加,相关,not_relevant),然后我保存到不同的名称,但它不起作用。 Weka说火车和测试装置不兼容。
答案 0 :(得分:1)
它们不兼容,因为训练集和测试集的结构不同。
如果您复制了文档(比如Testing.arff),然后将其作为测试集提供,那么分类器将接受该文件。但是,如果从测试文件中删除已使用的属性,则无法使用该文档,因为缺少某些输入(用于分类)或输出(用于评估)。
我在删除类输出时能够复制您的问题,但在复制文档时,测试集可以按预期正常工作。
希望这有帮助!