如何获得有关一系列列表的基本统计信息?

时间:2017-01-05 11:03:02

标签: python python-2.7 pandas

我有一个pandas DataFrame,我想得到关于它的基本统计数据,如唯一值的数量,每个值的出现次数。类似于df.describe

我的问题是有些列有列表,我收到此错误:

>>> df["col_a"].nunique()
TypeError: unhashable type: 'list'

我的专栏看起来像这样:

col_a:
["a","b"]
["b","a"]
["c"]
["a","b","c"]
[]
NaN

处理此问题的最简单方法是什么?

1 个答案:

答案 0 :(得分:3)

转换为可以清除的元组:

df['col_a'] = df['col_a'].dropna().apply(tuple)

输出:

       col_a
0     (a, b)
1     (b, a)
2       (c,)
3  (a, b, c)
4         ()
5        NaN

您现在可以执行此操作(返回5):

df['col_a'].nunique()