我是pandas
的新手,并且有大量CSV文件字节数,我想将CSV的值与两个数字进行比较,并计算csv文件数的差异
grouped = df.groupby('a')
grouped.count()
df.groupby(['234355' '18923422']).size()
# df.groupby(['0' '1023']).size()
我的csv文件值
600
0
600
272
600
272
1025
2411
272
152507
600
....
预期输出:
count
234355 - 18923422 2352
0 - 1023 15,233,233
18923423 1
答案 0 :(得分:3)
使用Series.between
作为布尔掩码,然后将True
乘以sum
,它的过程类似于1
s:
out = df['a'].between(0, 1023).sum()
print (out)
8