与pandas unique values multiple columns类似,我想计算每列的唯一值数。但是,由于dtypes不同,我得到以下错误:
数据框看起来像
small[['TARGET', 'title']].apply(pd.Series.describe)
给出了结果,但仅针对类别类型,我不确定如何仅使用每列唯一值来过滤最后一行的索引
答案 0 :(得分:1)
使用apply
和np.unique
获取每列中的唯一值并获取其size
:
small[['TARGET','title']].apply(lambda x: np.unique(x).size)
谢谢!