我有一个时间序列(每天)的数据集,用于多个项目(例如用户)。 数据看起来像这样简化: https://i.ibb.co/Pj4TnHW/trans-original.jpg(由于缺少代表点,我无法发布图片,抱歉)
此数据集为每个用户具有所有相同的属性(例如度量)。这些措施是在每天的时间范围内采取的。每个用户都有自己的“活动日期”。
我的目标是将此时间序列(面向行)数据集转换为数据集,该数据集可用于监督学习。 我想要的布局看起来像这样: https://i.ibb.co/8DxYpCy/Unbenannt.jpg
目前,我将解决方案应用于具有约60个度量的数据集。 到目前为止,我通过在“ user_id”上进行迭代并使用pandas.melt(),pandas.transpose()函数应用了多个步骤来实现了这一目标。 但这需要大量的预格式化,并且在使用较大的数据集时会变慢。
有没有更好的方法来进行转换?我读到有关https://machinelearningmastery.com/convert-time-series-supervised-learning-problem-python/的信息,但这似乎是另一种问题...
// EDIT#1:根据要求,我创建了最小的笔记本/ python脚本,并使用简化的数据集来演示我在做什么:https://www.file-upload.net/download-13590592/timeseries_to_supervised.zip.html (Jupyter Notebook,导出的HTML版本,示例输入数据集)