我是python和pandas的新手,所以如果这是一个基本问题,请原谅我。我正在从csv文件中读取一些数据,我想从“ M”,“ F”和NaN的“性别”列中进行计数。下面的代码输出:
import pandas as pd
import numpy as np
df = pd.read_csv("....csv")
count = pd.value_counts(df['gender'],dropna=False)
这将输出:
M 22
F 3
NaN 1
但是,我不想仅仅将它们视为一个计数,而是希望将值分配给变量。即拥有
male = pd.value_counts(df['gender'],'M',dropna=False)
或类似的东西,给雄性= 22(雌性和Nan相同),但是我找不到使用熊猫的明显方法。 有什么建议吗?提前非常感谢!
答案 0 :(得分:0)
在此示例中,我们采用gender
过滤的== "male"
系列的计数
import pandas as pd
import random
df = pd.DataFrame({'gender': [random.choice(['male', 'female']) for x in range(100)]})
count_men = df[df["gender"] == "male"].count()
count_men
如果只需要整数,则可以将其作为零值:
count_men = df[df["gender"] == "male"].count()[0]