我目前正在通过重写一些使用其他语言编写的旧程序来学习python。但是由于某种原因,我一直遇到函数调用不断返回nan的问题。下面是一个代码片段。
如果我在梯度下降函数之外调用函数theta0PartialDerivative,则返回数字,否则返回nan。我不确定是什么问题?
def theta0PartialDerivative():
multBy=40.0
total=temp=0
for i in range(40):
temp+=theta0
temp+=theta1*sepalWidth[i]
temp+=theta2*petalLength[i]
temp+=theta3*petalWidth[i]
temp-=sepalLength[i]
total=total+temp
temp=0
return (multBy*total)
def gradientDescent():
alpha=0.5
global theta0,theta1,theta2,theta3
theta0After=theta1After=theta2After=theta3After=1
while(theta0After!=theta0 and theta1After!=theta1 and
theta2After!=theta2 and theta3After!=theta3):
theta0=theta0After
theta1=theta1After
theta2=theta2After
theta3=theta3After
theta0After=theta0 - (alpha * theta0PartialDerivative())
theta1After=theta1 - (alpha * theta1PartialDerivative())
theta2After=theta2 - (alpha * theta2PartialDerivative())
theta3After=theta3 - (alpha * theta3PartialDerivative())
theta0=theta1=theta2=theta3=accuracy=0
gradientDescent()
编辑:真的吗?没有人知道这是什么问题吗?
答案 0 :(得分:0)
发现了问题。阶跃变量Alpha太大(对于我正在处理的数据集),导致偏导数发散而不是收敛。我将alpha从0.5更改为0.13,并且可以正常工作