我有一个数据集,其中包含日期时间数据作为索引,以及一些变量,但这里只有两个相关 - “价格”和“数量”。 link to screenshot of data
所以我在这里想要实现的是通过总结数量将突出显示的观察结果合并在一起。问题在于,可能存在以不同价格同时进行交易的情况,我只想在以下情况下合并观察结果:
索引是相同的,AND
价格相同。
要明确的是,我希望根据上面列出的条件永久修改整个数据集。任何帮助将不胜感激。
答案 0 :(得分:0)
假设数据集是NamedTuple
的列表填充。您可以使用itertools中的groupby按日期时间和价格进行过滤。
from itertools import groupby
after_merge = []
for _, group in groupby(dataset, key=lambda item: (item["datetime"], item["price"]):
quantity = sum(item["quantity"] for item in group)
record = group[0]
record["quantity"] = quantity
after_merge.append(record)
答案 1 :(得分:0)
如何使用熊猫:
import pandas as pd
#Write here the code that brings in your data
data=pd.DataFrame(oldData)
newdata=data.groupby(['index','price']).sum().values