我有一个带有特定列的.csv文件,我需要进行双尾t检验。以下是我的.csv文件示例:
Type|No.|Count
A |2 |4
B |5 |2
我需要将两种类型(A' s和B' s)分配给t-test的不同变量。更具体地说,我需要一个for循环(我假设),它将使用文件中所有A类型的编号值,并进行双尾t检验,比较A类型和B类型的编号值。然后,我需要对所有A类型和B类型的Count值进行另一个双尾t检验。 我一直在看熊猫,这对于排序.csv文件似乎很有用。我做了一个看起来像这样的测试:
groupby_type = data.groupby('A_B')
for type, value in groupby_type['No.']:
print((type, value.mean()))
这会产生正确的结果。但是,当我尝试使用scipy-lectures中的示例进行双尾t检验时,我得到了一个NAN结果。这是代码:
A_type = (data[data['A_B'] == 'A']['No.'])
B_type = (data[data['A_B'] == 'B']['No.'])
sig = scipy.stats.ttest_ind([A_type], [B_type])
运行时,我收到以下消息:
Ttest_indResult(statistic=nan, pvalue=nan)
我不知道为什么这会得到一个纳米值,并且我无法理解如何解决这个问题。谢谢!