熊猫也许会出问题。
具有这样的数据框
Col1 Col2
['joe', 'joe'] ['joe']
['sam','bob'] ['sam'.'bob']
['mary','mary'] ['mary']
我想在Col1上使用Apply函数在Col2中获取结果。意思是,我希望在Col1中具有重复项的列表不再在Col2中具有那些重复项。尝试使用套用和设置各种功能,没有骰子。似乎应该很简单,但请紧握笔记本电脑,事实并非如此。似乎如此。
答案 0 :(得分:2)
要获得第二列
df['ColB'] = df['Col1'].explode().groupby(level=0).unique()
答案 1 :(得分:0)
在该列上应用list(set(x))
怎么样?很酷的RAW尝试;-)
import numpy as np
import pandas as pd
df = pd.DataFrame({
'A': [[1,2],[3,4,3],[6,7,8]]
})
df['A'] = df['A'].apply(lambda x: list(set(x)))
print(df)
仍然没有人能战胜爆炸!
df['A'].explode().groupby(level=0).unique()