我们正在处理一项需要用Python编程的不同统计练习的作业。 一切进展顺利,我们现在只遇到了技术问题。 我们从sklearn导入了一个数据集,定义了数据框,现在我们想在两个不同的列中彼此测试均值(知道必须使用哪种统计测试绝对不是我们的问题)。我们根本不知道如何比较来自不同数据帧的两列。你能帮我们吗?我们尝试使用
Chas_0 = regressors[regressors['CHAS'] == 0.0]['DIS']
Chas_1 = regressors[regressors['CHAS'] == 1.0][outcome[outcome'MEDV']]
print(Chas_0.mean(),Chas_1.mean())
我们曾经在一个练习中学习过它,但是在一个数据帧中有两列。
有关更多背景信息,请参考我们对练习的完整回答:
from sklearn import datasets
import pandas as pd
boston = datasets.load_boston()
regressors = pd.DataFrame(boston.data, columns=boston.feature_names)
outcome = pd.DataFrame(boston.target, columns=["MEDV"]).values[:]
NOX = pd.DataFrame(boston.target, columns=["NOX"]).values[:]
import numpy as np
import scipy.stats as stats
Chas_0 = regressors[regressors['CHAS'] == 0.0]['DIS']
Chas_1 = regressors[regressors['CHAS'] == 1.0][outcome[outcome'MEDV']]
print(Chas_0.mean(),Chas_1.mean())
stats.wilcoxon(regressors[regressors['DIS']],outcome[outcome['MEDV']])
先谢谢您,
松懈