Question

熊猫也许会出问题。

具有这样的数据框

    Col1           Col2
['joe', 'joe']     ['joe']
['sam','bob']     ['sam'.'bob']
['mary','mary']   ['mary']

我想在Col1上使用Apply函数在Col2中获取结果。意思是，我希望在Col1中具有重复项的列表不再在Col2中具有那些重复项。尝试使用套用和设置各种功能，没有骰子。似乎应该很简单，但请紧握笔记本电脑，事实并非如此。似乎如此。

Answer 1

要获得第二列

df['ColB'] = df['Col1'].explode().groupby(level=0).unique()

Answer 2

在该列上应用list(set(x))怎么样？很酷的RAW尝试;-）

import numpy as np
import pandas as pd
df = pd.DataFrame({
    'A': [[1,2],[3,4,3],[6,7,8]]
})
df['A'] = df['A'].apply(lambda x: list(set(x)))
print(df)

仍然没有人能战胜爆炸！

df['A'].explode().groupby(level=0).unique()

删除熊猫列中列表中的重复项

2 个答案: