使用Python(SciPy,NumPy)分析和比较两个依赖数据集?

时间:2017-03-03 18:28:06

标签: python numpy scipy statistics analysis

我有两个依赖样本的学生群,其中两个不同的时间(在考试和考试之外)从他们那里获得数据。我想知道比较这两个相关数据集的最佳方法,以确定我在两种情况下获得的数据之间是否存在相关性。

一个例子是我已经计算了学生在考试条件下完成任务的效率。我希望能够比较两个样本,并确定情况(考试/不考试)和效率之间是否存在相关性。我的数据如下:

  • 实验室平均效率:0.707788246655

  • 标准差:0.262576910658

  • 实验室外的平均效率:0.722516939257

  • 标准差:0.254893744412

我在.csv文件中存储了许多其他指标,我希望在这些指标之间进行比较,例如速度,所用时间等,以确定这些指标与学生情况之间是否存在相关性。

我已经确定,置信区间可能有助于查看样本之间是否存在显着差异,我还查看了SciPy包进行数据分析,但我不知道从哪里开始或者是什么和没用。

0 个答案:

没有答案