machine-learning - WEKA输出中缺少值

时间：2018-10-20 02:11:05

标签： machine-learning weka

我正在尝试使用WEKA在各种数据集上比较J48和MLP。其中之一是：https://archive.ics.uci.edu/ml/datasets/primary+tumor。我已将其转换为CSV格式，可以轻松将其导入WEKA。您可以在这里下载此文件：https://ufile.io/8nj13

我在类和所有属性上使用了“数字到标称值”以适合数据的自然结构。但是，当我运行J48（和MLP）时，我遇到了一堆问号“？”。在我的输出中，大概是由于没有足够的适当类型的观察/实例。

我该如何解决？我敢肯定，这种事情一定有一个过滤器。我在下面附了一张图片。

答案 0 :(得分：1)

由于没有实例实际上被归类为该特定类，所以详细的准确性表正在显示一个问号。例如，这意味着由于没有实例被分类为16类，因此WEKA无法为您提供有关所述16类分类的详细信息。 This图片可能有助于您理解。

关于适当类的实例数量，您可以使用 weka / filters / supervised / instance / ClassBalancer 中的ClassBalancer过滤器。这应该有助于平衡各种类别的数量。

还请注意，您的数据集包含一些缺失值，可以通过丢弃具有缺失数据的实例或运行位于 weka / filters / unsupervised / attribute / ReplaceMissingValues 的ReplaceMissingValues过滤器来解决。