如何从pandas.DataFrame
中的列中删除很少发生的值,即频率较低的值?例如:
In [4]: df[col_1].value_counts()
Out[4]: 0 189096
1 110500
2 77218
3 61372
...
2065 1
2067 1
1569 1
dtype: int64
所以,我的问题是:如何删除2065, 2067, 1569
等其他值?我如何为包含.value_counts()
的所有列执行此操作?
更新: 关于'低'我的意思是像2065
这样的价值观。该值出现在col_1
1(一)次,我想删除这样的值。