我有一个问题要根据两个列数据对消除行数据。我有一百个CSV数据。
我的数据如下:
ID Annotation
A first
A last
B first
C first
C last
D last
E first
E last
我想消除仅出现一个的ID列中的行。
我使用了以下代码:
files = glob.glob("Data-*.csv")
for f in files:
df = pd.read_csv(f)
df = df[df.groupby('ID').ID.transform(len) > 1]
df.to_csv('New' + ' ' + f)
和:
df[df.duplicated('ID',keep=False)]
和
df1['count'] = df1.groupby(['ID']).transform(pd.Series.count)
df1 = df1[df1['count']>1]
df1
我遇到一个错误:
Wrong number of items passed 4, placement implies 1
,但仅出现一个数据。我的预期结果如下:
ID Annotation
A first
A last
C first
C last
E first
E last
编辑
对于测试数据,这些代码工作得很好。但是,对于我的原始数据,不是。这是原始的Data
之一