我试图为偏斜和峰度值做出结果。 我使用了着名的titanic.age数据。 首先,我在pandas.dataframe中使用了skew和kurtosis函数,后来我使用了scipy.stat函数。
以下是代码和结果。
import numpy
from scipy.stats import skew
from scipy.stats import kurtosis
import pandas
# load data
f = "titanic_survival.csv"
titanic_survival = pandas.read_csv(f)
# retrieve age data
titanic_age = titanic_survival['age'].dropna()
# use dataframe
skew_age_df = titanic_age.skew()
kurtosis_age_df = titanic_age.kurtosis()
#use scipy
skew_age_scipy = skew(titanic_age)
kurtosis_age_scipy = kurtosis(titanic_age)
...
>> result
skew_age_df = 0.40767188649782937
kurtosis_age_df = 0.14694996016357953
skew_age_scipy = 0.4070870379484177
kurtosis_age_scipy = 0.14051780299368888
我应该使用哪一个进行此计算? 为什么结果不同?