将以逗号分隔的字符串转换为熊猫列表

时间:2019-12-11 09:58:03

标签: python-3.x pandas list

我有一个包含两列的数据框。每列都有逗号分隔的字符串。我正在尝试将此字符串转换为列表,因此可以为以下数据集的每一行减去两个列表,分别为a_b = list(set(a) - set(b))

  Col1      Col2
  a,b,c,f   d,f,g
  d,g       w,a,d
  f,g,h     f,g,h

我尝试将项目转换为以下列表

df1['Col1']tolist()

但是它似乎不起作用。谢谢。

1 个答案:

答案 0 :(得分:3)

您可以使用str.split将以逗号分隔的字符串拆分为list。您也可以将apply(set)用于IIUC:

(df['Col1'].str.split(',').apply(set) - df['Col2'].str.split(',').apply(set)).tolist()

[出]

[{'a', 'b', 'c'}, {'g'}, set()]