删除熊猫列中列表中的重复项

时间:2020-11-12 01:42:10

标签: python pandas

熊猫也许会出问题。

具有这样的数据框

    Col1           Col2
['joe', 'joe']     ['joe']
['sam','bob']     ['sam'.'bob']
['mary','mary']   ['mary']

我想在Col1上使用Apply函数在Col2中获取结果。意思是,我希望在Col1中具有重复项的列表不再在Col2中具有那些重复项。尝试使用套用和设置各种功能,没有骰子。似乎应该很简单,但请紧握笔记本电脑,事实并非如此。似乎如此。

2 个答案:

答案 0 :(得分:2)

要获得第二列

df['ColB'] = df['Col1'].explode().groupby(level=0).unique()

答案 1 :(得分:0)

在该列上应用list(set(x))怎么样?很酷的RAW尝试;-)

import numpy as np
import pandas as pd
df = pd.DataFrame({
    'A': [[1,2],[3,4,3],[6,7,8]]
})
df['A'] = df['A'].apply(lambda x: list(set(x)))
print(df)

仍然没有人能战胜爆炸!

df['A'].explode().groupby(level=0).unique()