我正在尝试使用WEKA在各种数据集上比较J48和MLP。其中之一是:https://archive.ics.uci.edu/ml/datasets/primary+tumor。我已将其转换为CSV格式,可以轻松将其导入WEKA。您可以在这里下载此文件:https://ufile.io/8nj13
我在类和所有属性上使用了“数字到标称值”以适合数据的自然结构。但是,当我运行J48(和MLP)时,我遇到了一堆问号“?”。在我的输出中,大概是由于没有足够的适当类型的观察/实例。
我该如何解决?我敢肯定,这种事情一定有一个过滤器。我在下面附了一张图片。
答案 0 :(得分:1)
由于没有实例实际上被归类为该特定类,所以详细的准确性表正在显示一个问号。例如,这意味着由于没有实例被分类为16类,因此WEKA无法为您提供有关所述16类分类的详细信息。 This图片可能有助于您理解。
关于适当类的实例数量,您可以使用 weka / filters / supervised / instance / ClassBalancer 中的ClassBalancer过滤器。这应该有助于平衡各种类别的数量。
还请注意,您的数据集包含一些缺失值,可以通过丢弃具有缺失数据的实例或运行位于 weka / filters / unsupervised / attribute / ReplaceMissingValues 的ReplaceMissingValues过滤器来解决。