以pandas.Series的形式返回分类变量的分布

时间:2018-07-05 10:45:26

标签: python pandas

我有一个Pandas DataFrame,它的最后一列作为标签,一个值为[0, 1]的分类变量,我们称之为df['label']。数据框如下所示:

feat1   feat2...featn   label
.       .       .       0
.       .       .       1
.       .       .       .
.       .       .       1

现在,我需要返回一个长度为2的名为sex的熊猫系列,其中包含这些整数值和索引= ['male', 'female']。到目前为止,我仍然坚持使用交叉表功能,但无法获得所需的系列。

pd.crosstab(index = df['label'], columns='count')

1 个答案:

答案 0 :(得分:1)

如果没有df的样例或预期输出的图像,我假设您要寻找的是value_counts()函数?

Click Here to view input

 import pandas as pd
df = pd.DataFrame({'Label_1':[0,1,1,1]})

df.Label_1.replace(to_replace=1, value='Male', inplace=True) 
df.Label_1.replace(to_replace=0, value='Female',inplace=True)


pd.DataFrame(df.Label_1.value_counts())

Click Here to view Output

让我知道是否关闭了吗?