在大熊猫中保存一对行数据

时间:2019-06-23 14:26:15

标签: python pandas

我有一个问题要根据两个列数据对消除行数据。我有一百个CSV数据。
我的数据如下:

ID  Annotation
A   first
A   last
B   first
C   first
C   last
D   last
E   first
E   last

我想消除仅出现一个的ID列中的行。

我使用了以下代码:

files = glob.glob("Data-*.csv") 
for f in files:
    df = pd.read_csv(f)
    df = df[df.groupby('ID').ID.transform(len) > 1]
    df.to_csv('New' + ' ' + f)

和:

df[df.duplicated('ID',keep=False)]

df1['count'] = df1.groupby(['ID']).transform(pd.Series.count) 
df1 = df1[df1['count']>1]
df1

我遇到一个错误:

Wrong number of items passed 4, placement implies 1

,但仅出现一个数据。我的预期结果如下:

ID  Annotation
A   first
A   last
C   first
C   last
E   first
E   last

编辑

对于测试数据,这些代码工作得很好。但是,对于我的原始数据,不是。这是原始的Data

之一

0 个答案:

没有答案