数据集如下:
import pandas as pd
X = pd.DataFrame({'id': [1,1,1,2,2,3,3,3,3],
'time': [-1,-5,-10,-2,-4,-1,-4,-7,-10],
'var1': [1,2,1,3,1,2,1,3,1],
'var2': [3,3,1,4,1,3,3,1,2],
'var3': [4,5,6,1,3,5,6,7,8]})
Y = pd.DataFrame({'id': [1,2,3],
'label': [0,1,0]})
在X中,列ID为示例,时间反映事件发生在多少天之前。 Var1..3是与事件关联的功能(分类)。 在Y中,列标签是要预测的响应。
在实际数据集中,每个样本的事件数量变化很大,从1到极少。
如何使用Keras LSTM通过X数据帧中过去事件的特征来对Y数据帧中的标签进行预测?