Question

我希望我能尽可能清楚。我有一个Excel文件，其中包含400个要研究的科目，并且每个人都有其年龄，性别和40多个生物学变量列。 Es：CODE0001；（年龄）20; M \ F;生物值1； BioValue 2 ..... Biovalue 40.

我的目标是使用1向Anova分析这些数据，因为我认为这是我最好的选择。我正在尝试这样做（甚至使用本指南https://www.marsja.se/four-ways-to-conduct-one-way-anovas-using-python/），但代码始终存在问题。

那么：我如何设置数据以便能够使用该网站的代码？

我已经为所有数据完成了Dataset.mean（）和Dataset.std（），但是我不能使用例如“ Mean Age”值，因为Jupyter似乎只能将其读取为字符串，并且不是一个值。

我处于混乱的状态，所以我们将不胜感激所有帮助！

提前谢谢

Answer 1

使用df.mean()或df.std()时，请先尝试将数据更改为pd.Series并运行它。

Answer 2

对不起，我听不懂。我对python比较陌生，所以也许我无法正确解释自己。我需要进行Anova分析：

首先，我这样做了

AnalisiISAD.mean()

2）然后我从中列出了一个清单：

MeanList = [......] 3）然后我进行了方差分析脚本

AnalisiI.boxplot('MeanList', by='AgeT0', figsize=(12,8))

ctrl = Analisi['MeanList'][Analisi == 'ctrl']

grps = pd.unique(Analisi.group.values)

d_data = {grp:Analisi['MeanList'][Analisi.group ==grp] for grp in grps}

k = len(pd.unique(Analisi.group))

N = len(Analisi.values)

n = Analisi.groupby('AgeT0').size()[0]

但发生此错误：KeyError: 'Column not found: MeanList'

这是否意味着我必须在excel文件中创建一个新列？我该怎么办？

方差分析Analysis Python_Urgent

2 个答案: