回归高斯过程(GPR)和Logistic回归(LR)

时间:2014-05-29 19:41:22

标签: matlab machine-learning statistics

我想实施风险预测模型(生成一个百分比)。我知道LR对于这项工作是足够的,但我想尝试GPR。

我的问题是:在这种情况下,GPR是一个合适的选择吗?我知道GPR是在函数上生成概率分布,它可以为丢失的数据提供稳健的估计,但是有可能进行概率预测吗? (或高斯分类过程可以做到这一点?)

感谢您的帮助。 : - )

2 个答案:

答案 0 :(得分:0)

GPR用于回归问题。 LR适用于" Classification"

您应该使用高斯过程,然后使用非线性(如softmax)进行分类,这需要对学习和预测进行一些近似。它包含在以下链接中。您可以运行演示以查看其工作原理: http://www.gaussianprocess.org/gpml/code/matlab/doc/

答案 1 :(得分:0)

逻辑回归是二元响应变量的回归方法(几乎是@Daniel所说的,但并不完全相同)。如果您的风险可以被解释为违约概率/崩溃/无论如何,那么如果您可以安排您的数据具有“默认”和#34;那么Logistic回归可能是合适的。或者"没有违约"而不是风险百分比作为因变量。

如果没有,你就会对这个百分比感到屈服。您可以使用高斯过程,或任何其他回归量。我说'卡住'的原因是什么?使用标准方法对与区间[0,1]绑定的数字进行回归存在一些问题,因为标准线性回归量(或GP,或SVR,或其他)通常在整个实线上定义。为了解决这个问题,你可以专门使用Beta回归(y~Beta),它将因变量限制在适当的范围内,或者对变换后的百分比进行回归(例如,logit或probit变换的比例将在整个实线上)