我想今天以mm计算降雨量。所以我想首先了解线性回归或 Logistic回归问题以及如何计算我是否有一些具有大号的属性的数据集。实例。
以及如何知道何时使用功能扩展&如果我不在必要的地方使用功能扩展,我的程序将如何影响。
我可以使用特征缩放的java代码。
答案 0 :(得分:1)
如果您正在计算今天的降雨量,那么您应该选择最适合此问题的线性回归。
由于金额属于R(真实),因此它是具体值,如果您有分类特别是二元分类,那么您必须使用 Logistic回归。
假设今天计算降雨量有6个属性,那么你的模型必须是: -
y = w(0)+x(1)w(1)+x(2)w(2)+x(3)w(3)+x(4)w(4)+x(5)w(5)+x(6)w(6)
y
是您想要预测的降雨量
x(1)...x(6)
属性和w(0)...w(6)
必须计算的内容。
然后你应该减少一个损失函数: -
现在你要计算w(0)... w(6)。
现在使用渐变下降
//实际上我没有任何渐变下降的图像,但我可以让你理解这一点
theta(j)
为w(j)
,alpha
为学习率。并且E
为J(theta)
,t(p)
的值为y(p)
是预测值,即原始y
。
当数据太稀疏时可以完成feature scaling,这可以通过最大元素划分所有元素来完成。这样做是为了规范化独立数据。首先选择特征然后进行缩放。
有关Linear regression的更多信息
为什么不能在这里应用逻辑回归?
因为在逻辑回归中,我们得到了最适合二元分类的S形曲线
高于0.5取1或者真或小于0.5取0或假。
希望这对你有用。