我如何在weka的探索者中做到这一点:
•对于每个类,生成具有最高T值的顶部2,4,6,8,10,12,15,20,25和30个顶级基因的子集
我的数据采用以下格式:
instances/classes
| | |
----------
| | |
基因/属性----------
| | |
----------
| | |
(行是属性,列是实例)
答案 0 :(得分:0)
Weka不适合这样的子集生成,你可以完成这个壮举,但这并不容易。我建议将你的数据放到其他程序并生成你的子集,之后使用weka进行分类和聚类,这是weka的主要观点。
您可以使用R / Matlab / Python或SQL数据库生成此子集。