我有一个pandas DataFrame,我想得到关于它的基本统计数据,如唯一值的数量,每个值的出现次数。类似于df.describe
。
我的问题是有些列有列表,我收到此错误:
>>> df["col_a"].nunique()
TypeError: unhashable type: 'list'
我的专栏看起来像这样:
col_a:
["a","b"]
["b","a"]
["c"]
["a","b","c"]
[]
NaN
处理此问题的最简单方法是什么?
答案 0 :(得分:3)
转换为可以清除的元组:
df['col_a'] = df['col_a'].dropna().apply(tuple)
输出:
col_a
0 (a, b)
1 (b, a)
2 (c,)
3 (a, b, c)
4 ()
5 NaN
您现在可以执行此操作(返回5
):
df['col_a'].nunique()