C ++决策树存储

时间:2013-05-24 07:57:23

标签: c++ decision-tree

我有一个决策树。 我为这个决策树提供了一些输入值。 然后决策树返回一个值。

输入值可以是“子女数”,“年龄年龄”等。 然后,决策树可以返回(例如)某个值,该值可以指示该家庭拥有多少辆汽车或类似的东西。

此决策树(如果转换为if-then语句)将如下所示:

int i=0;

if (ownedHouses==0)
{
    if (numberOfChildren==4)
    {
        if (ageFather==39)
        {
            if (incomeFamily==40000)
            {
                if (carsAlreadyCrashed==1)
                {
                    i=3;
                }
                else
                {
                    if (carsAlreadyCrashed==2)
                    {
                        if (insurancePaysForCrashes==1)
                        {
                            i=5;
                        }
                      }
                      else
                      {
                            i=4;
                        }
                    }
                    else
                    {
                        i=11;
                    }
                }
            }
            else
            {
                i=2;
            }
        }
        else
        {
            i=9;
        }
    }
    else
    {
        i=22;
    }
else
{
    i=8;
}

这只是一个例子。实际上,由此产生的if-then语句绝对是巨大的。虽然我可以解析数据并从中创建这样的if-then,但我无法在我的软件中使用如此大的if-then-loop。

因此,我正在寻找一种将决策树集成到我的软件中的不同方法。

我已经看到了在运行时解析决策树数据(以它提供的任何形式......)的方法,然后从中创建具有根,节点和叶子的类。

就我的目的而言,这还不够快。

有人有任何其他想法吗?

感谢您的帮助。

编辑:我已将部分值更改为现实值,以使含义更清晰。

1 个答案:

答案 0 :(得分:1)

我所知道的最快实现是在ALGLIB中实现的。 决策树存储为双精度数组。

  • 叶节点 - 两个值{-1,数据}。
  • 非叶节点 - 三个值{input_value_index,threshold,right_branch_offset}。

您可以在dforest.dfprocessinternal

中找到此方法的实现