因此,我有一个文档正在尝试按PdDistrict进行排序,以使我知道每个地区发生了多少事件。
到目前为止,我已经上传了文档,并且将名称更改为Neighbourhood并将其作为默认列,我只需要正确计算计数即可。
sf=pd.read_csv('https://cocl.us/sanfran_crime_dataset',sep=',',delimiter=None)
sf.drop(['IncidntNum','Category','Descript','DayOfWeek','Date','Time','Resolution','Address','X','Y','Location','PdId'], axis=1, inplace=True)
sf.rename(columns={'PdDistrict':'Neighborhood'}, inplace=True)
sf['count'] = sf.rename_axis('MyIdx').sort_values(by = ['Neighborhood', 'MyIdx'], ascending = [False, True])
sf
就像我之前说的,我需要两列,一列显示邻居,一列显示该邻居的犯罪数量