应用错误收集

我试图为偏斜和峰度值做出结果。我使用了着名的titanic.age数据。首先，我在pandas.dataframe中使用了skew和kurtosis函数，后来我使用了scipy.stat函数。

以下是代码和结果。

import numpy
from scipy.stats import skew
from scipy.stats import kurtosis
import pandas

# load data
f = "titanic_survival.csv"
titanic_survival = pandas.read_csv(f)

# retrieve age data
titanic_age = titanic_survival['age'].dropna()

# use dataframe
skew_age_df = titanic_age.skew()
kurtosis_age_df = titanic_age.kurtosis()

#use scipy
skew_age_scipy = skew(titanic_age)
kurtosis_age_scipy = kurtosis(titanic_age)
...

>> result
skew_age_df = 0.40767188649782937
kurtosis_age_df = 0.14694996016357953

skew_age_scipy = 0.4070870379484177
kurtosis_age_scipy = 0.14051780299368888

我应该使用哪一个进行此计算？为什么结果不同？

pandas.dataframe和scipy.stats之间的区别结果

0 个答案: