在列中删除重复值

时间:2019-02-12 13:24:31

标签: python pandas

我有一个类似的框架;

df = pd.DataFrame({'America':["24,23,24,24","10","AA,AA, XY"]})

试图将其转换为列表,设置等。但是句柄

我如何删除重复项

2 个答案:

答案 0 :(得分:1)

splitset使用自定义功能:

df['America'] = df['America'].apply(lambda x: set(x.split(',')))

另一种解决方案是使用列表理解:

df['America'] = [set(x.split(',')) for x in df['America']]

print (df)
     America
0   {23, 24}
1       {10}
2  {AA,  XY}

答案 1 :(得分:1)

这是使用str.split的一种方法。

例如:

import pandas as pd

df = pd.DataFrame({'America':["24,23,24,24","10","AA,AA, XY"]})
print(df["America"].str.split(",").apply(set))

输出:

0     {24, 23}
1         {10}
2    {AA,  XY}
Name: America, dtype: object