如何仅使用value_counts()

时间:2016-07-24 16:44:15

标签: python pandas

原始数据框:

from pandas import Series, DataFrame
import pandas as pd
%pylab inline

df=pd.read_csv('NYC_Restaurants.csv', dtype=unicode)

original df

我使用了一个掩码来隔离所需的行(那些在列中只出现一次的行)

mask = df['DBA'].value_counts()[df['DBA'].value_counts() == 1]

产生预期结果

但是,使用df[mask]会产生一个奇怪的数据帧,第一列重复多次;而不是仅使用选定的行回馈原始数据框

Output from using mask

1 个答案:

答案 0 :(得分:0)

而不是使用value_counts();我使用了groupby,它提供了我正在寻找的东西。

mask = df.groupby("DBA").filter(lambda x: len(x) == 1)