我正在尝试根据2列对我的csv数据进行排序

时间:2020-07-01 23:45:43

标签: python csv sorting

实际上,我是从以前的问题解答中提取代码的。但是,我的输出不是我预期的。我正在通过仅2列来整理数据集。这是我正在使用的精炼数据集,sp ::

      ACC_TIME     COUNTY_NAME
978       0:01         Harford
952       0:01    Anne Arundel
995       0:01  Prince Georges
1059      0:01         Carroll
941       0:01  Prince Georges
...        ...             ...
17535     9:12       Frederick
17536     9:12       Frederick
17251     9:12    Anne Arundel
17507     9:12      Dorchester
18636     9:12       Frederick

sp只是df,特定的列已删除。 这是我的代码:

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import csv
from operator import itemgetter
from datetime import datetime
import operator



df=pd.read_csv("2012CarCrashes.csv")
df.drop(['ACC_TIME_CODE','ROAD', 'INTERSECT_ROAD','DIST_FROM_INTERSECT', 'CITY_NAME', 
         'DIST_DIRECTION', 'COUNTY_CODE', 'VEHICLE_COUNT', 'PROP_DEST', 
         'COLLISION_WITH_2', 'CASE_NUMBER', 'BARRACK'], axis=1,inplace=True) #--> inplace=True means to update the df file

df["ACC_DATE"]= pd.to_datetime(df["ACC_DATE"])  #-->converts datatype to datetime

df = df.sort_values('ACC_TIME') #-->sorts according to time of accident
.
.
.
.
sp =df.drop(['ACC_DATE','DAY_OF_WEEK','INJURY','COLLISION_WITH_1'],axis=1)

#Next, how can I organize the data by county and time of accidents? 

sp1 = sorted(sp, key=operator.itemgetter(0, 1))
print(sp1)

这是我不断得到的输出:

['ACC_TIME', 'COUNTY_NAME']

看,它只打印两列的标题,而没有其他内容。

我可能做错了什么?

1 个答案:

答案 0 :(得分:1)

使用DataFrame方法对DataFrame进行排序。 sorted()不支持DataFrame,并且DataFrame对象只是对其列名称进行迭代:

>>> import pandas as pd
>>> df = pd.DataFrame([[2,3,4],[1,3,5],[2,1,7]],columns=['A','B','C'])
>>> df
   A  B  C
0  2  3  4
1  1  3  5
2  2  1  7
>>> df = df.sort_values(['A','B'])
>>> df
   A  B  C
1  1  3  5
2  2  1  7
0  2  3  4