熊猫df.describe()-如何将值提取到Dataframe中?

时间:2019-01-27 22:45:59

标签: python pandas dataframe data-science

我试图做一个朴素的贝叶斯,然后将一些数据加载到Pandas中的数据框中,然后describe函数捕获我想要的数据。我想从表的每一列中捕获均值和标准差,但不确定如何做到这一点。我已经尝试过类似的事情:

df.describe([mean])
df.describe(['mean'])
df.describe().mean

没有人在工作。我能够用摘要在R中执行类似的操作,但不知道如何在Python中执行。有人可以提供一些建议吗?

3 个答案:

答案 0 :(得分:3)

请尝试以下操作:

df.describe(include='all').loc['mean']

答案 1 :(得分:2)

你很近。您不需要任何include标签。只需正确地重写第二种方法即可:df.describe()['mean']

例如:

import pandas as pd

s = pd.Series([1, 2, 3, 4, 5])
s.describe()['mean']
# 3.0

如果您同时需要meanstd,只需写df.describe()[['mean', 'std']]。例如,

s.describe()[['mean', 'std']]
# mean    3.000000
# std     1.581139
# dtype: float64

答案 2 :(得分:0)

如果您还想提取特定的列数据,请尝试:

df.describe()['FeatureName']['mean']

用您想要提取的任何其他统计数据替换均值