我有一个包含两列的数据框。每列都有逗号分隔的字符串。我正在尝试将此字符串转换为列表,因此可以为以下数据集的每一行减去两个列表,分别为a_b = list(set(a) - set(b))
。
Col1 Col2
a,b,c,f d,f,g
d,g w,a,d
f,g,h f,g,h
我尝试将项目转换为以下列表
df1['Col1']tolist()
但是它似乎不起作用。谢谢。
答案 0 :(得分:3)
您可以使用str.split
将以逗号分隔的字符串拆分为list
。您也可以将apply(set)
用于IIUC:
(df['Col1'].str.split(',').apply(set) - df['Col2'].str.split(',').apply(set)).tolist()
[出]
[{'a', 'b', 'c'}, {'g'}, set()]