计数熊猫并将输出分配给变量

时间:2018-12-15 20:56:43

标签: python pandas

我是python和pandas的新手,所以如果这是一个基本问题,请原谅我。我正在从csv文件中读取一些数据,我想从“ M”,“ F”和NaN的“性别”列中进行计数。下面的代码输出:

    import pandas as pd
    import numpy as np

    df = pd.read_csv("....csv")
    count = pd.value_counts(df['gender'],dropna=False)

这将输出:

    M      22
    F       3
    NaN     1

但是,我不想仅仅将它们视为一个计数,而是希望将值分配给变量。即拥有

    male = pd.value_counts(df['gender'],'M',dropna=False)

或类似的东西,给雄性= 22(雌性和Nan相同),但是我找不到使用熊猫的明显方法。 有什么建议吗?提前非常感谢!

1 个答案:

答案 0 :(得分:0)

在此示例中,我们采用gender过滤的== "male"系列的计数

import pandas as pd
import random
df = pd.DataFrame({'gender': [random.choice(['male', 'female']) for x in range(100)]})
count_men = df[df["gender"] == "male"].count()
count_men

如果只需要整数,则可以将其作为零值:

count_men = df[df["gender"] == "male"].count()[0]