我有一个数据框如下:
date uids
0 2018-11-23 [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13]
1 2018-11-24 [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13]
当我使用set
将其转换为设置时,它会失败:
df['uids'] = set(df['uids']) # IT FAILS!
我应该如何将list
转换为set
?
答案 0 :(得分:4)
您应该使用DataFrame API的 apply 方法:
df['uids'] = df.apply(lambda row: set(row['uids']), axis=1)
或
df = df['uids'].apply(set) # great thanks to EdChum
您可以找到有关应用方法here的更多信息。
使用示例
df = pd.DataFrame({'A': [[1,2,3,4,5,1,1,1], [2,3,4,2,2,2,3,3]]})
df = df['A'].apply(set)
输出:
>>> df
0 set([1, 2, 3, 4, 5])
1 set([2, 3, 4])
Name: A, dtype: object
或者:
>>> df = pd.DataFrame({'A': [[1,2,3,4,5,1,1,1], [2,3,4,2,2,2,3,3]]})
>>> df['A'] = df.apply(lambda row: set(row['A']), axis=1)
>>> df
A
0 set([1, 2, 3, 4, 5])
1 set([2, 3, 4])