比较两个数据框的方法

时间:2018-06-23 14:00:31

标签: python-3.x

我们正在处理一项需要用Python编程的不同统计练习的作业。 一切进展顺利,我们现在只遇到了技术问题。 我们从sklearn导入了一个数据集,定义了数据框,现在我们想在两个不同的列中彼此测试均值(知道必须使用哪种统计测试绝对不是我们的问题)。我们根本不知道如何比较来自不同数据帧的两列。你能帮我们吗?我们尝试使用

Chas_0 = regressors[regressors['CHAS'] == 0.0]['DIS']
Chas_1 = regressors[regressors['CHAS'] == 1.0][outcome[outcome'MEDV']]
print(Chas_0.mean(),Chas_1.mean())

我们曾经在一个练习中学习过它,但是在一个数据帧中有两列。

有关更多背景信息,请参考我们对练习的完整回答:

from sklearn import datasets 
import pandas as pd

boston = datasets.load_boston()
regressors = pd.DataFrame(boston.data, columns=boston.feature_names)
outcome = pd.DataFrame(boston.target, columns=["MEDV"]).values[:]
NOX = pd.DataFrame(boston.target, columns=["NOX"]).values[:]

2双面T检验

import numpy as np
import scipy.stats as stats

Chas_0 = regressors[regressors['CHAS'] == 0.0]['DIS']
Chas_1 = regressors[regressors['CHAS'] == 1.0][outcome[outcome'MEDV']]
print(Chas_0.mean(),Chas_1.mean())

3 Wilcoxon检验

stats.wilcoxon(regressors[regressors['DIS']],outcome[outcome['MEDV']])

先谢谢您,

松懈

0 个答案:

没有答案