我的数据框有一个名为dir
的列,它有几个值,我想知道有多少值通过某个点。例如:
df['dir'].value_counts().sort_index()
返回Series
0 855
20 881
40 2786
70 3777
90 3964
100 4
110 2115
130 3040
140 1
160 1697
180 1734
190 3
200 618
210 3
220 1451
250 895
270 2167
280 1
290 1643
300 1
310 1894
330 1
340 965
350 1
Name: dir, dtype: int64
在这里,我想知道传递500的值的数量。在这种情况下,除了100,140,190,210,280,300,330,350之外都是。
我该怎么做?
我可以逃脱df['dir'].value_counts()[df['dir'].value_counts() > 500]
答案 0 :(得分:1)
(df['dir'].value_counts() > 500).sum()
这将获取值计数并将其作为一系列真值返回。 parens将整个事情视为一系列事件。 .sum()
将True值计为1,将False值计为0。