应用错误收集

Logistic回归 - 在Python中使用分类变量？

时间：2017-10-29 08:29:37

标签： python pandas regression statsmodels

我有一个数据集，包括7个不同的协变量和一个输出变量，即“成功率”。我试图找出预测成功率的重要因素。我的数据集中的一个协变量是一个分类变量，它带有700个值（0到700），每个值代表它们所来自的区域的ID。在执行逻辑回归时如何处理此变量？如果我制作700个虚拟列，我怎样才能更容易理解结果呢？我正在使用Python和statsmodels。

1 个答案:

答案 0 :(得分：1)

您可以应用分组，然后对每个组进行逻辑回归。或者您将其视为多标签分类器并进行＆＃34; Softmax回归＆＃34;。

Rpy2中的分类变量（因子函数）
具有分类预测因子的R中的Logistic回归
解释逻辑回归中的分类变量重要性
将数字变量更改为分类变量？
Logistic回归 - 在Python中使用分类变量？
r中逻辑回归的分类变量
多项Logistic回归中的分类因变量
以类别变量作为因变量和混合自变量的回归以及多重共线性的回归
何时在Logistic回归中将分类变量（独立变量）转换为数值变量？
如何在Python中定义类别变量的级别？

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？