我有一个具有这种格式的数据框:
[timestamp][location code] [feature code][measurement]
意思是我可以拥有类似的东西:
TS LOC FEAT MEAS
2015-01-24 03:45:00 agb feat1 26
2015-01-25 04:00:00 agb feat1 27
2015-01-25 04:30:00 agb feat2 47
2015-01-17 12:00:00 fmq feat1 16
2015-01-18 12:00:00 fmq feat1 22
我所做的就是使用pd.unique
和tolist()
来获取地点的名称并将其存储在列表中,但我似乎无法弄清楚如何动态地将它们分成数据帧,并将位置代码作为该数据帧的名称。
我希望拥有一个变量agb
,这是一个像这样的数据框:
2015-01-24 03:45:00 agb feat1 26
2015-01-25 04:00:00 agb feat1 27
2015-01-25 04:30:00 agb feat2 47
和变量fmq
,这是一个像这样的数据框:
2015-01-17 12:00:00 fmq feat1 16
2015-01-18 12:00:00 fmq feat1 22
我可以通过迭代LOC
列表并执行groupby
和get_group
作为第二部分,我似乎也无法弄清楚(并且无法很好地说明问题,以便在堆栈溢出中寻找答案)如何产生测量的变化。
例如在fmq
中我想要另一列DEL
,这是各种功能的测量值之间的差异。类似的东西:
TS LOC FEAT MEAS DEL
2015-01-17 12:00:00 fmq feat1 16
2015-01-18 12:00:00 fmq feat1 22 6
非常感谢任何帮助。感谢。