Logistic回归机器学习模型可以在这里工作吗?

时间:2018-12-20 03:25:27

标签: python machine-learning neural-network classification logistic-regression

我10年级,我希望对患者数据使用机器学习模型,以发现一周中的时间与患者依从性之间的相关性。我将一周分为21个时段,一天中的每个时段分别划分为三个时段(1个是周一上午,两个是周一下午,依此类推)。坚持值将是二进制的(0表示未服用药物,1表示已服用药物)。我将为模型模拟训练,验证和测试数据。根据我的理解,我可以使用逻辑回归模型,根据给定时间段的过去数据,在某个时间段输出患者错过服药的可能性。这是因为逻辑回归在给定阈值时会输出二进制值,并且对于处理概率和二进制类别的问题非常有用,这就是我的情况。就我而言,我要处理的两个班级是,他们会吃药,不,他们不会。但是这样做的主要问题是,至少在我看来,该数据将是非线性的。为了更清楚地说明这一点,让我举一个真实的例子。如果患者在星期日早上(时隙19)上瑜伽课,并且倾向于此时忘记服药,则时隙19下的大多数数字将为0,而所有其他时隙将有更多的数字。 1秒目标是创建一个机器学习模型,该模型可以了解给定的过去数据,患者很可能在下一个时隙19错过服药。我相信必须对仍然具有内在线性数据的数据使用逻辑回归分布,但是我不确定。我还了解到神经网络是非线性分布的理想选择,但是神经网络需要大量数据才能正常运行,理想情况下,我的模型的目标是仅用几个星期的数据就能正常运行。当然,任何数据都有更多的模型变得更加准确,但是在我看来,一般而言,神经网络需要成千上万的数据集才能真正变得相当准确。同样,我很可能是错的。

我的问题是,实际上哪种模型类型可以在这里工作。我确实知道我将需要某种形式的监督分类。但是,如果在一周中的某个时间给出依从性,我可以使用逻辑回归进行预测吗?

真的很感谢我的项目任何一般反馈!请记住,我只有15岁,因此我所作的某些陈述可能是错误的,并且我将无法完全理解非常复杂的答复。

我还必须在接下来的两周内完成此操作,因此请不要犹豫,尽快回复!非常感谢!

2 个答案:

答案 0 :(得分:0)

在我看来,逻辑回归尚不足以解决此问题,因为您将使用单个参数作为输入。当我想象出针对该问题的决策线时,我认为无法通过单个神经元来实现(逻辑回归)。这样做可能需要更多的神经元,甚至需要几层神经元。为此,您可能需要很多数据集。

答案 1 :(得分:0)

确实,您需要大量数据来应用神经网络。 如果您可以更精确地了解数据集和功能,将会很有帮助。您也可以尝试为您的项目实施K-Means-Clustering。如果您的目的是找出患者是否服药,则可以使用逻辑回归来完成。

相关问题