我为python做了一个简单的渐变下降实现,它适用于大多数参数,但是对于学习速率和迭代次数的某些参数,它给我一个运行时错误。
RuntimeWarning:在double_scalars中遇到溢出
RuntimeWarning:double_scalars中遇到无效值
现在我正在假设,因为它有一个点,其中b和m值变得太大而无法存储在内存中,因为存在溢出错误,这个假设是否正确?
我如何防止程序崩溃,因为主程序中的异常处理似乎不起作用,你能想到一种没有异常处理的方法来逻辑上防止错误吗?
def compute_error(points,b,m):
error = 0
for i in range(len(points)):
y = ponts[i][1]
x = points[i][0]
error += (y - (m*x + b))**2
return error/len(points)
def gradient_runner(points,LR,num_iter,startB=0,startM=0):
b = startB
m = startM
for i in range(num_iter):
b,m = step_gradient(points,b,m,LR)
return [b,m]
def step_gradient(points,b,m,LR):
b_gradient = 0
m_gradient = 0
N = float(len(points))
for i in range(len(points)):
x = points[i][0]
y = points[i][1]
b_gradient+= (-2/N)*(y - ((m*x)+b))
m_gradient+= (-2/N)*x*(y - ((m*x)+b))
## print "Value for b_gradient",b_gradient
## print "Value for b is ",b
## print "Value for learning rate is ",LR
new_b = b - (LR * b_gradient)
new_m = m - (LR * m_gradient)
return [new_b,new_m]
import numpy as np
a = np.array([[1,1],[4,2],[6,3],[8,4],[11,5],[12,6],[13,7],[16,8]])
b,m=gradient_runner(a,0.0001,1000) # These parameters work
# b,m=gradient_runner(a,0.1,10000) #Program Crashes
yguesses = [m * i + b for i in a[:,0]]
import matplotlib.pyplot as plt
guezz= yguesses
plt.scatter(a[:,0], a[:,1] ,color="green")
plt.plot(a[:,0],guezz,color="red")
plt.show()
答案 0 :(得分:1)
问题在于学习率' LR(仅通过改变LR进行测试 - 你会发现如果你足够低,算法会收敛)。由于LR
的值过高,每次都会采取太大的步骤(想象一下,你会跳过每一步的正确值)。有办法计算最大步长应该是多少。谷歌一点点(例如"梯度下降步长")。
但是,正如您所注意到的,如果您遇到溢出,结果很可能是错误的。在Python中,您可以使用catch warnings来告诉用户结果是错误的。