我正在学习tslearn。但是我对输入数据格式很困惑。假设有一个数据框:
a=pd.DataFrame({'cla':['a','a','a','a','b','b','b'],
'value':[1,2,3,4,2,4,1]})
我希望a和b分别是独立的时间序列。因此,它看起来像:
a: 1,2,3,4
b: 2,4,1
根据tslearn,输入示例为:
X = to_time_series_dataset([[1, 2, 3, 4], [1, 2, 3], [2, 5, 6, 7, 8, 9]])
所以,我该如何将数据传输到:
[[1,2,3,4],[2,4,1]]
非常感谢。
答案 0 :(得分:2)
尝试:
a.groupby('cla').agg(list)['value'].to_list()