我有一个来自sqlite的大数据库,后来变成了以下DataFrame。
dfObj:
ID routeID acnr x y
1 6 4 100,1 99,7
2 6 4 100,2 99,9
3 6 4 99,4 100,4
4 6 3 60,7 60,7
5 6 2 87,9 88,6
6 6 4 120,2 100,5
7 6 6 30,4 35,9
8 6 1 96,0 94,5
9 6 2 85,3 93,6
10 6 6 35,7 38,3
11 6 4 99,9 98,9
12 6 3 62,1 62,1
13 6 4 100,0 100,5
14 6 4 99,6 100,6
15 6 4 101,1 99,3
使用下一个代码并重命名列名称后:
df_route_action_freq = dfObj.groupby(['acnr']).agg({'routeId': 'size', 'x':'mean', 'y':'mean'}).reset_index()
我得到以下数据框:
acnr freq mean_x mean_y
1 1 96,0 94,5
2 2 86,6 91,1
3 2 61,4 61,4
4 8 102,6 100,0
6 2 33,1 37,1
如您所见,第6行是acnr 4的离群值。每个x值约为acnr = 4的100,第6行说x = 120。
您知道dfOBj和df_route_action_freq之间的删除大纲视图的方法吗?
非常感谢您。