我有一个csv,它作为大约1500个位置的数据,格式如下:
LOCATION DATE VALUE
0001 10/23/2018 350
0001 10/24/2018 351
0001 10/25/2018 500
,位置列表会持续显示约1500个位置。
我需要的期望输出是:
3 dimensional(samples,timesteps,features)
从上面的输出中可以看出,除转置字段外,我还需要python程序来创建两个新字段(DATE和VALUE)。我真的不知道如何将其创建为python,因为我对python的工作还不够。
我们非常感谢您的帮助。
谢谢
答案 0 :(得分:3)
使用pd.melt
。假设您已将数据读入名为df
的DataFrame中:
import pandas as pd
pd.melt(df,
id_vars='LOCATION',
var_name='DATE',
value_name='VALUE')
LOCATION DATE VALUE
0 0001 10/23/2018 350
1 0002 10/23/2018 400
2 0005 10/23/2018 250
3 0001 10/24/2018 351
4 0002 10/24/2018 200
5 0005 10/24/2018 200
6 0001 10/25/2018 500
7 0002 10/25/2018 400
8 0005 10/25/2018 300
9 0001 10/26/2018 600
10 0002 10/26/2018 250
11 0005 10/26/2018 400