我想知道我是否可以将分类技术(例如Logistic回归)应用于其变量/预测变量被索引的数据。按时间。或者如果没有,那么在这些类型的数据中使用哪种分类技术。
为了让您清楚地了解问题,请说我有一个因变量Y,其值为0或1(对于二进制案例分类),或1,2,3,...(对于'多分类)。
我有预测变量,这些变量被编入索引'按时间,即X1T1,X1T2,......,X1Tn,X2T1,X2T2,......,X2Tm,...... XpTk,
其中
X1T1 = values of variable X1 at time 1 (T1)
X1T2 = values of variable X1 at time 2 (T2)
.
.
X1Tn = values of variable X1 at time n (Tn)
X2T1 = values of variable X2 at time 1 (T1)
X2T2 = values of variable X2 at time 2 (T2)
.
.
X2Tm = values of variable X2 at time m (Tm)
.
.
.
XpTk = values of variable Xp at time k (Tk)
其中n,m,k = 1,2,...(可变时间'索引') p = 1,2,....(预测变量数)。
对于数据视图,我们有;
Obs Y X1T1 X1T2 ... X1Tn X2T1 X2T3 ... X2Tm ... XpTk
1 . . . . . . . .
2 . . . . . . . ... .
.
.
.
N . . . . . . . ... .
我可以对这些类型的数据应用分类技术,比如说Logistic回归(或者像基于树的方法那样的多类别响应变量的其他分类技术。)非常感谢!
答案 0 :(得分:0)
您可以使用您的数据来拟合Logistic回归模型。 但是,结果可能不太好,因为算法会独立考虑每个变量。
使用数据拟合LR模型的一种方法是使新的变量可以被认为是彼此独立的,并保留足够的信息来表示原始数据。
例如)
newvar1 = mean(X1T1, X1T2, ..., X1Tn),
newvar2 = sd(X1T1, X1T2, ..., X1Tn),
newvar3 = mean increasing ratio(X1T1, X1T2, ..., X1Tn)
...
这样,您可以使用您的数据来拟合LR模型,即使新变量的示例不够用。