我有一个类似的框架;
df = pd.DataFrame({'America':["24,23,24,24","10","AA,AA, XY"]})
试图将其转换为列表,设置等。但是句柄
我如何删除重复项
答案 0 :(得分:1)
对split
和set
使用自定义功能:
df['America'] = df['America'].apply(lambda x: set(x.split(',')))
另一种解决方案是使用列表理解:
df['America'] = [set(x.split(',')) for x in df['America']]
print (df)
America
0 {23, 24}
1 {10}
2 {AA, XY}
答案 1 :(得分:1)
这是使用str.split
的一种方法。
例如:
import pandas as pd
df = pd.DataFrame({'America':["24,23,24,24","10","AA,AA, XY"]})
print(df["America"].str.split(",").apply(set))
输出:
0 {24, 23}
1 {10}
2 {AA, XY}
Name: America, dtype: object