原始数据框:
from pandas import Series, DataFrame
import pandas as pd
%pylab inline
df=pd.read_csv('NYC_Restaurants.csv', dtype=unicode)
我使用了一个掩码来隔离所需的行(那些在列中只出现一次的行)
mask = df['DBA'].value_counts()[df['DBA'].value_counts() == 1]
产生预期结果
但是,使用df[mask]
会产生一个奇怪的数据帧,第一列重复多次;而不是仅使用选定的行回馈原始数据框
答案 0 :(得分:0)
而不是使用value_counts();我使用了groupby,它提供了我正在寻找的东西。
mask = df.groupby("DBA").filter(lambda x: len(x) == 1)