我已经学习了Logistic回归几天,我认为逻辑回归的数据集的标签需要是1或0,是不是?
但是当我查找libSVM库的regression dataset时,我看到标签值是连续数字(例如1.0086,1.0089 ......),我错过了什么吗?
请注意,libSVM库可用于回归问题。
非常感谢!
答案 0 :(得分:3)
与其名称相反,逻辑回归是一种分类算法,它输出以数据点为条件的类概率。因此,训练集标签需要为0或1.对于您提到的数据集,逻辑回归不是合适的算法。
SVM是一种分类算法,它使用输入标签-1或1.它不是概率算法,也不输出类概率。它也可以适应回归。
答案 1 :(得分:0)
您是使用第三方库还是自己编程?通常,标签用作基本事实,因此您可以看到您的方法的效果。
例如,如果您的算法试图预测某个特定实例可能输出-1,则地面实况标签将为+1,这意味着您未成功对该特定实例进行分类。
答案 2 :(得分:0)
请注意,“回归”是一个通用术语。说某人将进行回归分析并不一定告诉你他们将使用什么算法,也不一定告诉你数据集的所有性质。所有它真正告诉你的是,你有一组样本,你想用它来预测一个结果值(一个条件概率的模型)。
逻辑回归和线性回归之间的一个主要区别是,前者通常在分类的二元标记样本集上进行训练;而后者则接受真实标记(ℝ)样本集的培训。
任何时候您的标签都是真正有价值的,这意味着您可能会使用线性回归或类似标签,或者将这些实值标签转换为分类标签(例如通过阈值或箱子)你想要实际使用逻辑回归。如果您尝试将一个此类问题设置转换为另一个问题,则结果的质量和解释可能会有很大差异。