您如何根据Python中的ANOVA F检验来模拟具有统计意义的数据?

时间:2018-11-12 18:47:06

标签: python machine-learning statistics supervised-learning

我正在读10年级,我正在寻找一个机器学习科学博览会项目的模拟数据。最终模型将用于患者数据,并将预测一周或一天中的某些时间与单个患者数据内药物依从性的影响之间的相关性。坚持值将是小数部分(即在星期三,他们在正确的时间服用了所需药3次中的两次),该星期三的坚持值为0.67。我正在寻找一种机器学习模型,该模型能够从星期几和一天中的时间之间的关系中学习,并能与患者的依从性进行学习,并在给定标签“每周几日”或“一天中的时间”。为此,我希望模拟1,000名患者的数据。每位患者将获得30周的数据。数据将分为4组,每组250位患者。在第一组中,一个趋势(坚持一天的时间)将被认为具有统计学显着性。在另一组中,其他趋势将被视为具有统计显着性(遵守的星期几)。在另一个方面,这两个趋势都将是重要的,而在另一个方面,则没有一个趋势将是重要的。

但是,为了确定在一天中的许多时间中,一天是否对依从性有统计学上显着的影响,由于涉及多个变量,因此必须使用F检验。我不能仅仅将某天的遵守率大大降低,并希望取得最好的进展,因为必须根据统计统计来将趋势视为重要。

我知道有一些模块可以使用F检验来评估数据集,但是我正在寻找一种创建可以通过F检验的数据的方法。这些数据不是线性的,这使问题更加棘手。

有人对我将如何执行此操作提出建议,或者是否应该完全使用其他方法?

任何帮助(甚至对我的项目的一般评论)都将不胜感激!

0 个答案:

没有答案