使用alglib进行线性判别分析

时间:2015-07-27 08:25:35

标签: c++ alglib

我被要求对我的一个项目的一组数据进行线性判别分析。我正在使用具有fisherlda功能的ALGLIB(C ++版本)但我需要一些帮助来理解如何使用它。

用户回答一组6个问题(答案是1-7中的数字),这给出了一个例如数据集的例子。 {1,2,3,4,5,6}。然后我有5个类,每个6个值,例如{0.765,0.895,1.345,2.456,0.789,5.678}。 fisher lda函数采用二维数组值并返回另一个1d数组值(我不知道它们是什么意思)。

据我了解,我需要查看用户最适合哪个班级?

理解LDA的任何帮助和/或我如何使用此功能将不胜感激。

编辑:

以下是我正在尝试使用的函数的定义:

/*************************************************************************
Multiclass Fisher LDA

Subroutine finds coefficients of linear combination which optimally separates
training set on classes.

INPUT PARAMETERS:
    XY          -   training set, array[0..NPoints-1,0..NVars].
                    First NVars columns store values of independent
                    variables, next column stores number of class (from 0
                    to NClasses-1) which dataset element belongs to. Fractional
                    values are rounded to nearest integer.
    NPoints     -   training set size, NPoints>=0
    NVars       -   number of independent variables, NVars>=1
    NClasses    -   number of classes, NClasses>=2


OUTPUT PARAMETERS:
    Info        -   return code:
                    * -4, if internal EVD subroutine hasn't converged
                    * -2, if there is a point with class number
                          outside of [0..NClasses-1].
                    * -1, if incorrect parameters was passed (NPoints<0,
                          NVars<1, NClasses<2)
                    *  1, if task has been solved
                    *  2, if there was a multicollinearity in training set,
                          but task has been solved.
    W           -   linear combination coefficients, array[0..NVars-1]

  -- ALGLIB --
     Copyright 31.05.2008 by Bochkanov Sergey
*************************************************************************/
void fisherlda(const real_2d_array &xy, const ae_int_t npoints, const ae_int_t nvars, const ae_int_t nclasses, ae_int_t &info, real_1d_array &w);

1 个答案:

答案 0 :(得分:2)

您正在使用fisherlda函数,这是LDA算法的一种实现。

LDA(线性判别分析)旨在找到最能表征或分离两类或更多类物体或事件的特征的线性组合。

假设线y = wx(w,x在这里都代表矩阵),所以fisherlad的给定结果是1d系数数组,即w。然后你可以使用这一行来确定答案属于哪一类