时间依赖预测器/变量数据的Logistic回归(分类技术)

时间:2016-03-21 10:23:25

标签: classification regression logistic-regression

我想知道我是否可以将分类技术(例如Logistic回归)应用于其变量/预测变量被索引的数据。按时间。或者如果没有,那么在这些类型的数据中使用哪种分类技术。

为了让您清楚地了解问题,请说我有一个因变量Y,其值为0或1(对于二进制案例分类),或1,2,3,...(对于'多分类)。

我有预测变量,这些变量被编入索引'按时间,即X1T1,X1T2,......,X1Tn,X2T1,X2T2,......,X2Tm,...... XpTk,

其中

 X1T1 = values of variable X1 at time 1 (T1)
 X1T2 = values of variable X1 at time 2 (T2) 
    .
    .
 X1Tn = values of variable X1 at time n (Tn)
 X2T1 = values of variable X2 at time 1 (T1)
 X2T2 = values of variable X2 at time 2 (T2)
    .
    .
 X2Tm = values of variable X2 at time m (Tm)
    .
    .
    .
 XpTk = values of variable Xp at time k (Tk)

其中n,m,k = 1,2,...(可变时间'索引')           p = 1,2,....(预测变量数)。

对于数据视图,我们有;

 Obs   Y   X1T1   X1T2 ... X1Tn  X2T1  X2T3 ... X2Tm ...  XpTk
  1    .     .      .        .     .     .       .          .
  2    .     .      .        .     .     .       .   ...    .
  .
  .
  .
  N    .     .       .       .     .     .       .   ...    .      

我可以对这些类型的数据应用分类技术,比如说Logistic回归(或者像基于树的方法那样的多类别响应变量的其他分类技术。)非常感谢!

1 个答案:

答案 0 :(得分:0)

您可以使用您的数据来拟合Logistic回归模型。 但是,结果可能不太好,因为算法会独立考虑每个变量。

使用数据拟合LR模型的一种方法是使新的变量可以被认为是彼此独立的,并保留足够的信息来表示原始数据。

例如)

newvar1 = mean(X1T1, X1T2, ..., X1Tn),
newvar2 = sd(X1T1, X1T2, ..., X1Tn),
newvar3 = mean increasing ratio(X1T1, X1T2, ..., X1Tn)
...

这样,您可以使用您的数据来拟合LR模型,即使新变量的示例不够用。