Question

我是python和pandas的新手，所以如果这是一个基本问题，请原谅我。我正在从csv文件中读取一些数据，我想从“ M”，“ F”和NaN的“性别”列中进行计数。下面的代码输出：

    import pandas as pd
    import numpy as np

    df = pd.read_csv("....csv")
    count = pd.value_counts(df['gender'],dropna=False)

这将输出：

    M      22
    F       3
    NaN     1

但是，我不想仅仅将它们视为一个计数，而是希望将值分配给变量。即拥有

    male = pd.value_counts(df['gender'],'M',dropna=False)

或类似的东西，给雄性= 22（雌性和Nan相同），但是我找不到使用熊猫的明显方法。有什么建议吗？提前非常感谢！

Answer 1

在此示例中，我们采用gender过滤的== "male"系列的计数

import pandas as pd
import random
df = pd.DataFrame({'gender': [random.choice(['male', 'female']) for x in range(100)]})
count_men = df[df["gender"] == "male"].count()
count_men

如果只需要整数，则可以将其作为零值：

count_men = df[df["gender"] == "male"].count()[0]

计数熊猫并将输出分配给变量

1 个答案: