python - Python中逻辑回归中的受控变量

您可能已经知道，控制变量是实验者不感兴趣研究的那些变量，但相信它们确实在因变量所取值中起着重要作用。因此，人们在进行实验（即收集数据）时通常会将此变量的值保持恒定。

举一个例子，假设您正在尝试模拟一个人的健康状况，即对他是否健康进行分类，并且您正在考虑将年龄，性别和他/她的运动方式作为模型的输入并想要学习每个输入如何影响目标变量。但是您很清楚，受试者所在的国家/地区也会对他的健康状况（对气候，健康设施等进行编码）有发言权。因此，为了确保此变量（国家/地区）不会影响您的模型，请确保仅从一个国家/地区收集所有数据。

因此，回答您的第一个问题，没有python没有说明受控变量。它只是假设您要输入的所有输入变量都是实验人员感兴趣的。

关于您的第二个问题，一种处理控制变量的方法是，首先对数据进行分组，以便每个组现在都具有该控制变量的常数值，现在我们为每个变量运行Logistic回归或任何模型分别分组，然后“合并”来自不同模型的结果。但是，如果您的控制变量中的级别数确实很高，则这种方法就会瓦解，在这种情况下，我们通常将控制变量视为一个自变量，并将其提供给我们的模型。

有关更多详细信息，请参阅1或2，它们确实有一些不错的解释。

Python中逻辑回归中的受控变量

1 个答案: