Question

原始数据框：

from pandas import Series, DataFrame
import pandas as pd
%pylab inline

df=pd.read_csv('NYC_Restaurants.csv', dtype=unicode)

original df

我使用了一个掩码来隔离所需的行（那些在列中只出现一次的行）

mask = df['DBA'].value_counts()[df['DBA'].value_counts() == 1]

产生预期结果

但是，使用df[mask]会产生一个奇怪的数据帧，第一列重复多次;而不是仅使用选定的行回馈原始数据框

Output from using mask

Answer 1

而不是使用value_counts（）;我使用了groupby，它提供了我正在寻找的东西。

mask = df.groupby("DBA").filter(lambda x: len(x) == 1)