Question

我有一个问题要根据两个列数据对消除行数据。我有一百个CSV数据。
我的数据如下：

ID  Annotation
A   first
A   last
B   first
C   first
C   last
D   last
E   first
E   last

我想消除仅出现一个的ID列中的行。

我使用了以下代码：

files = glob.glob("Data-*.csv") 
for f in files:
    df = pd.read_csv(f)
    df = df[df.groupby('ID').ID.transform(len) > 1]
    df.to_csv('New' + ' ' + f)

和：

df[df.duplicated('ID',keep=False)]

和

df1['count'] = df1.groupby(['ID']).transform(pd.Series.count) 
df1 = df1[df1['count']>1]
df1

我遇到一个错误：

Wrong number of items passed 4, placement implies 1

，但仅出现一个数据。我的预期结果如下：

ID  Annotation
A   first
A   last
C   first
C   last
E   first
E   last

编辑

对于测试数据，这些代码工作得很好。但是，对于我的原始数据，不是。这是原始的Data

之一

在大熊猫中保存一对行数据

0 个答案: