我想找到两个均值(男性与女性)之间差异的置信区间。我浏览了 statsmodels 的索引,找到了下面的函数。但是它没有解释我应该在哪里指定男性和女性系列。请指教。
功能:
CompareMeans.tconfint_diff(alpha=0.05, alternative='two-sided', usevar='pooled')
答案 0 :(得分:2)
两个系列的描述性统计量应该以CompareMeans
格式传递给DescrStatsW
类。之后,您可以使用 tconfint_diff
类的 CompareMeans
方法获取均值差异的置信区间。
import pandas as pd
import numpy as np
from statsmodels.stats.weightstats import DescrStatsW, CompareMeans
df = pd.DataFrame({
'Male': np.random.normal(loc=50, scale=5, size=100),
'Female': np.random.normal(loc=50, scale=25, size=100),
})
cm = CompareMeans(d1=DescrStatsW(data=df['Male']), d2=DescrStatsW(data=df['Female']))
lower, upper = cm.tconfint_diff(alpha=0.05, alternative='two-sided', usevar='unequal')