最频繁和最不频繁的数字和离群值-Jupyter

时间:2019-12-04 12:32:38

标签: python jupyter exploratory

id |car_id
0  |  32
.  |   2
.  |   3
.  |   7
.  |   3
.  |   4
.  |  32
N  |   1

如何从id_car列中选择频率最高和频率最低的数字,并将其显示在经常出现的新表格中?'car_id'和'quantity'

mdata['car_id'].value_counts().idxmax()

1 个答案:

答案 0 :(得分:1)

这里有一些代码将提供最频繁的ID和三个最不频繁的ID。

from collections import Counter
car_ids = [32, 2, 3, 7, 3, 4, 32, 1]
c = Counter(car_ids)
count_pairs = c.most_common() # Gets all counts, from highest to lowest.
print (f'Most frequent: {count_pairs[0]}') # Most frequent: (32, 2)
n = 3
print (f'Least frequent {n}: {count_pairs[:-n-1:-1]}') # Least frequent 3: [(1, 1), (4, 1), (7, 1)]

count_pairs包含(ID,该ID的 count )对的列表。从最频繁到最不频繁进行排序。 most_common不会告诉我们联系的顺序。

如果只需要任何频率最低的ID,则可以将n更改为1。我将其设为3,这样您就可以看到最少出现的并列三个。