我一直在使用一个数据集,其中包含有关在特定市场上出售的房屋的信息。有两列,“价格”和“日期”。
我想画一条线图,以显示该市场的价格随时间变化的情况。
问题是,我发现有些房屋是在同一天售出的,但价格不同。
因此,理想情况下,我需要在绘制之前获得每个日期出售房屋的均价/均价。
例如,如果我有这样的东西:
日期/价格
2015年2月5日/ $ 100
2015年2月5日/ $ 200
我需要获得一个新的行,其平均值如下:
日期/价格
2015年2月5日/ $ 150
我只是还无法弄清楚。我会很感激任何可以在这件事上为我提供指导的人。预先感谢。
答案 0 :(得分:0)
假设您使用的是熊猫:
pd.groupby('DATE')['PRICE'].mean()