方差分析Analysis Python_Urgent

时间:2020-05-19 14:54:16

标签: python database data-analysis anova

我希望我能尽可能清楚。 我有一个Excel文件,其中包含400个要研究的科目,并且每个人都有其年龄,性别和40多个生物学变量列。 Es:CODE0001; (年龄)20; M \ F;生物值1; BioValue 2 ..... Biovalue 40.

我的目标是使用1向Anova分析这些数据,因为我认为这是我最好的选择。我正在尝试这样做(甚至使用本指南https://www.marsja.se/four-ways-to-conduct-one-way-anovas-using-python/),但代码始终存在问题。

那么:我如何设置数据以便能够使用该网站的代码?

我已经为所有数据完成了Dataset.mean()和Dataset.std(),但是我不能使用例如“ Mean Age”值,因为Jupyter似乎只能将其读取为字符串,并且不是一个值。

我处于混乱的状态,所以我们将不胜感激所有帮助!

提前谢谢

2 个答案:

答案 0 :(得分:0)

使用df.mean()df.std()时,请先尝试将数据更改为pd.Series并运行它。

答案 1 :(得分:0)

对不起,我听不懂。我对python比较陌生,所以也许我无法正确解释自己。 我需要进行Anova分析:

首先,我这样做了

AnalisiISAD.mean()

2)然后我从中列出了一个清单:

MeanList = [......] 3)然后我进行了方差分析脚本

AnalisiI.boxplot('MeanList', by='AgeT0', figsize=(12,8))

ctrl = Analisi['MeanList'][Analisi == 'ctrl']

grps = pd.unique(Analisi.group.values)

d_data = {grp:Analisi['MeanList'][Analisi.group ==grp] for grp in grps}

k = len(pd.unique(Analisi.group))

N = len(Analisi.values)

n = Analisi.groupby('AgeT0').size()[0]

但发生此错误:KeyError: 'Column not found: MeanList'

这是否意味着我必须在excel文件中创建一个新列?我该怎么办?