我希望我能尽可能清楚。 我有一个Excel文件,其中包含400个要研究的科目,并且每个人都有其年龄,性别和40多个生物学变量列。 Es:CODE0001; (年龄)20; M \ F;生物值1; BioValue 2 ..... Biovalue 40.
我的目标是使用1向Anova分析这些数据,因为我认为这是我最好的选择。我正在尝试这样做(甚至使用本指南https://www.marsja.se/four-ways-to-conduct-one-way-anovas-using-python/),但代码始终存在问题。
那么:我如何设置数据以便能够使用该网站的代码?
我已经为所有数据完成了Dataset.mean()和Dataset.std(),但是我不能使用例如“ Mean Age”值,因为Jupyter似乎只能将其读取为字符串,并且不是一个值。
我处于混乱的状态,所以我们将不胜感激所有帮助!
提前谢谢
答案 0 :(得分:0)
使用df.mean()
或df.std()
时,请先尝试将数据更改为pd.Series
并运行它。
答案 1 :(得分:0)
对不起,我听不懂。我对python比较陌生,所以也许我无法正确解释自己。 我需要进行Anova分析:
首先,我这样做了
AnalisiISAD.mean()
2)然后我从中列出了一个清单:
MeanList = [......] 3)然后我进行了方差分析脚本
AnalisiI.boxplot('MeanList', by='AgeT0', figsize=(12,8))
ctrl = Analisi['MeanList'][Analisi == 'ctrl']
grps = pd.unique(Analisi.group.values)
d_data = {grp:Analisi['MeanList'][Analisi.group ==grp] for grp in grps}
k = len(pd.unique(Analisi.group))
N = len(Analisi.values)
n = Analisi.groupby('AgeT0').size()[0]
但发生此错误:KeyError: 'Column not found: MeanList'
这是否意味着我必须在excel文件中创建一个新列?我该怎么办?