Weka中FP-Growth的数据要求是什么?

时间:2013-01-12 12:01:03

标签: java data-mining weka

我想在Weka的数据集(模型)中使用FP-Growth关联规则算法。

不幸的是,这个算法是灰色的。我必须满足哪些先决条件才能使用它?

2 个答案:

答案 0 :(得分:21)

答案/解决方案:

  1. Weka实现的每个算法都有某种与之关联的摘要信息。要从GUI中查看它,必须单击算法(或过滤器)选项,然后再单击Capabilities按钮。然后会出现一个小弹出窗口,其中包含有关特定算法的一些信息。
  2. 如果是FPGrowth,则模型属性必须为binary类型。在我的情况下,我有一个名义和数字参数混合。我必须应用NominalToBinary过滤器,它将我的名义属性转换为二进制值。然后,我必须应用flter NumericToBinary并将所选选项ignoreClass设置为true
  3. 这有助于我在Weka中“解锁”FPGrowth

答案 1 :(得分:2)

添加到@ŁukaszBachman回答: 在应用过滤器操作之前,您需要将类设置为“无类”。如果您使用的是weka java api,那么您需要将data.setClassIndex(-1)添加到您的java代码中。

例如:在Java中执行Nominal To Binary:

        NominalToBinary nn = new NominalToBinary();
        nn.setInputFormat(Data);
        Data.setClassIndex(-1);
        Data = Filter.useFilter(Data, nn);