Question

我想知道我是否可以将分类技术（例如Logistic回归）应用于其变量/预测变量被索引的数据。按时间。或者如果没有，那么在这些类型的数据中使用哪种分类技术。

为了让您清楚地了解问题，请说我有一个因变量Y，其值为0或1（对于二进制案例分类），或1,2,3，...（对于＆＃39;多分类）。

我有预测变量，这些变量被编入索引＆＃39;按时间，即X1T1，X1T2，......，X1Tn，X2T1，X2T2，......，X2Tm，...... XpTk，

其中

 X1T1 = values of variable X1 at time 1 (T1)
 X1T2 = values of variable X1 at time 2 (T2) 
    .
    .
 X1Tn = values of variable X1 at time n (Tn)
 X2T1 = values of variable X2 at time 1 (T1)
 X2T2 = values of variable X2 at time 2 (T2)
    .
    .
 X2Tm = values of variable X2 at time m (Tm)
    .
    .
    .
 XpTk = values of variable Xp at time k (Tk)

其中n，m，k = 1,2，...（可变时间＆＃39;索引＆＃39;） p = 1,2，....（预测变量数）。

对于数据视图，我们有;

 Obs   Y   X1T1   X1T2 ... X1Tn  X2T1  X2T3 ... X2Tm ...  XpTk
  1    .     .      .        .     .     .       .          .
  2    .     .      .        .     .     .       .   ...    .
  .
  .
  .
  N    .     .       .       .     .     .       .   ...    .

我可以对这些类型的数据应用分类技术，比如说Logistic回归（或者像基于树的方法那样的多类别响应变量的其他分类技术。）非常感谢！

Answer 1

您可以使用您的数据来拟合Logistic回归模型。但是，结果可能不太好，因为算法会独立考虑每个变量。

使用数据拟合LR模型的一种方法是使新的变量可以被认为是彼此独立的，并保留足够的信息来表示原始数据。

例如）

newvar1 = mean(X1T1, X1T2, ..., X1Tn),
newvar2 = sd(X1T1, X1T2, ..., X1Tn),
newvar3 = mean increasing ratio(X1T1, X1T2, ..., X1Tn)
...

这样，您可以使用您的数据来拟合LR模型，即使新变量的示例不够用。

时间依赖预测器/变量数据的Logistic回归（分类技术）

1 个答案: