T检验和从列导入数据

时间:2018-11-22 07:18:09

标签: python pandas scipy probability t-test

我正在尝试使用以下代码对两个不相等的样本进行T检验。

import pandas as pd
import numpy as np
from scipy import stats

UG = pd.read_csv('Mostfrequentscores.csv')
print('Mean', UG['Iceland'].mean())
print('Mean', UG['Peru'].mean())

I = UG['Iceland']
P = UG['Peru']

t = stats.ttest_ind(I, P, equal_var = False)

平均打印效果很好,我认为这意味着它正在读取文件中的列-但T检验不断给我以下错误:

  

C:\ Users \ msu \ Anaconda3 \ lib \ site-packages \ scipy \ stats_distn_infrastructure.py:879:   RuntimeWarning:在更大的范围内遇到无效值

这可能是由于我的数据是从-3到3的一系列数字吗?我需要使用float进行转换吗?

0 个答案:

没有答案