Python中逻辑回归中的受控变量

时间:2019-07-01 22:43:07

标签: python scikit-learn logistic-regression

我刚刚了解了受控变量对我正在执行的项目的含义,并且我试图查找sci-kit learning是否具有受控变量选项。具体来说,Python是否具有用于逻辑回归的受控变量(而非独立变量)?

我搜索了一些东西,但没有找到适用于Python的内容。但是,我当时想的是更基本的方法,而控制变量意味着将您感兴趣的组分层(例如种族),然后根据x和y对每个组进行分析。如果这是正确的,那么我想解释那些分层的小组的结果,对吗?

对不起,我问了两个问题,但是我试图获得有关此受控组构想和Python应用程序的更多信息

1 个答案:

答案 0 :(得分:0)

您可能已经知道,控制变量是实验者不感兴趣研究的那些变量,但相信它们确实在因变量所取值中起着重要作用。因此,人们在进行实验(即收集数据)时通常会将此变量的值保持恒定。

举一个例子,假设您正在尝试模拟一个人的健康状况,即对他是否健康进行分类,并且您正在考虑将年龄,性别和他/她的运动方式作为模型的输入并想要学习每个输入如何影响目标变量。但是您很清楚,受试者所在的国家/地区也会对他的健康状况(对气候,健康设施等进行编码)有发言权。因此,为了确保此变量(国家/地区)不会影响您的模型,请确保仅从一个国家/地区收集所有数据。

因此,回答您的第一个问题,没有python没有说明受控变量。它只是假设您要输入的所有输入变量都是实验人员感兴趣的。

关于您的第二个问题,一种处理控制变量的方法是,首先对数据进行分组,以便每个组现在都具有该控制变量的常数值,现在我们为每个变量运行Logistic回归或任何模型分别分组,然后“合并”来自不同模型的结果。但是,如果您的控制变量中的级别数确实很高,则这种方法就会瓦解,在这种情况下,我们通常将控制变量视为一个自变量,并将其提供给我们的模型。

有关更多详细信息,请参阅12,它们确实有一些不错的解释。