我有两个依赖样本的学生群,其中两个不同的时间(在考试和考试之外)从他们那里获得数据。我想知道比较这两个相关数据集的最佳方法,以确定我在两种情况下获得的数据之间是否存在相关性。
一个例子是我已经计算了学生在考试条件下完成任务的效率。我希望能够比较两个样本,并确定情况(考试/不考试)和效率之间是否存在相关性。我的数据如下:
实验室平均效率:0.707788246655
标准差:0.262576910658
实验室外的平均效率:0.722516939257
标准差:0.254893744412
我在.csv文件中存储了许多其他指标,我希望在这些指标之间进行比较,例如速度,所用时间等,以确定这些指标与学生情况之间是否存在相关性。
我已经确定,置信区间可能有助于查看样本之间是否存在显着差异,我还查看了SciPy包进行数据分析,但我不知道从哪里开始或者是什么和没用。