我有以下数据集...
https://drive.google.com/open?id=1PpI6PlO8ox2vKfM4aGmEUexCPPWa59S_
如何创建一个新的DataFrame,其中第一列是唯一的邻域名称,而后两列则是每个邻域的最低和最高价格?
答案 0 :(得分:1)
您可以按主机分组并获得最大值和最小值,如下所示:
weapons.remove(weapon)
一种更Python化的方式是使用>>> data = pd.read_csv('dumbbell_data.csv')
>>> pd.DataFrame([[value.maxPrice.max(), value.minPrice.min(), key] for key, value in data.groupby('neighbourhood_hosts')], columns=data.columns)
maxPrice minPrice neighbourhood_hosts
0 45 45 Bloomsbury
1 247 117 Canonbury
2 112 72 Chelsea
3 160 29 LB of Barnet
4 80 72 LB of Hackney
5 321 58 Shepherd's Bush
6 72 55 Shoreditch
7 115 72 Wapping
8 120 58 Wimbledon
函数:
agg