在做的时候,只是一个渐变下降的简单实现(预测一条st线,样本点作为输入),我用迭代方法准确地预测了这条线,但是使用fmin_cg(),精度下降了, 第一个想法是增加函数中的'maxiter'参数,但令人惊讶的是它根本没有任何影响(结果与maxiters = 1和1000相同)。所以我心中有两个问题: 为什么没有影响。时间fmin_cg(),计算f和fprime,不应该结果的准确性与它成正比。 2.使用fmin_cg()(如果提供了apt fprime)保证返回f最小可能的参数。
我的代码:
def gradDesc(theta, data, alpha = None, iterations = None):
X = data[:, 0]
y = data[:, 1]
m = shape(X)[0]
X = c_[ones((m, 1)), X]
y = y.reshape(m, 1)
hypo = X.dot(theta)
grad = zeros((2, 1))
if alpha is not None : #"""iterative method"""
for i in range (0, iterations):
hypo = X.dot(grad)
ausi = X.T.dot(hypo - y)
grad -= alpha / m * ausi
else: #returns derivative of cost(), to use fmin_cg in run()
grad = X.T.dot(hypo.reshape(m, 1) - y)/m
# print(grad)
return grad.flatten()
def run(theta, data ):
result = scipy.optimize.fmin_cg( cost, fprime=gradDesc, x0=theta, \
args = (data, ), maxiter=1, disp=False, full_output=True )
theta = result[0]
minCost = result[1]
return theta, minCost
成本函数:
def cost( theta, data ):
X, y = data[:, 0], data[:, 1]
m = shape(X)[0]
y = y.reshape(m, 1)
X = c_[ones((m, 1)), X]
J = X.dot(theta) - y
# print((J.T.dot(J) / (2*m)) [0, 0])
return (J.T.dot(J) / (2*m)) [0, 0]
完整代码:http://ideone.com/IbB3Gb(两个版本,只需注释第4行和第5行需要切换):)