熊猫:计算数据框列中的不同元素

时间:2019-06-04 12:24:21

标签: python pandas

我有一个具有以下结构的数据框:

df = pd.DataFrame({'id_emp':[13524791000109, 12053850000137, 4707821000113, 4707821000112,4707821000114, 5707821000114, 5707821000114, 5707821000114],
       'name_dep': ['DIONILSO MATEUS MARCON', 'JOSE AUGUSTO ROSA', 'LUCIO ANTONIO MOSQUINI', 'DIEGO ALVES','BRUNO HENRIQUE', 'GABRIEL BARBOSA', 'DIONILSO MATEUS MARCON', 'BRUNO HENRIQUE']
       })

我如何解释每列中有多少不同的元素? 例如:在“名称_名称”列中,“ DIONILSO MATEUS MARCON”和“ BRUNO HENRIQUE”这两个名称出现了两次,但只计算一次。因此,该列中不同元素的预期输出为6。

2 个答案:

答案 0 :(得分:0)

您可以通过以下方式找到列的唯一元素:

df['id_emp'].unique()

具有以下特征的唯一元素:

df['id_emp'].nunique()

答案 1 :(得分:0)

df.nunique()

此方法返回唯一商品的数量