您好我正在尝试使用ALGLIB来计算rdf。不幸的是,我的每个训练样本都有两个以上的变量。我应该使用下面的函数,但我的训练数据有7个变量。我认为ALGLIB的实现只针对2个变量实现。我怎样才能将它用于7个可变训练样本?
public static void alglib.dfbuildrandomdecisionforestx1(
double[,] xy,
int npoints,
int nvars,
int nclasses,
int ntrees,
int nrndvars,
double r,
out int info,
out decisionforest df,
out dfreport rep)
提前致谢。我不是坚持使用ALGLIB,如果有另一个适合我的训练集的库,并且我可以使用它来实现随机决策林。
答案 0 :(得分:2)
您应该将所有训练样本放入大小为二维数组[npoints,nvars + 1],其中npoints =训练样本数,nvars =变量数(在您的情况下为7)和最后一列(+1)是为了类标签。
有关参数的更多信息,您可以在函数定义附近找到。
有关数据集格式的更多信息,请阅读 - > dataset format