Question

我尝试将Ax ^ 2 + Bx + C解为（ax + b）（cx + d），其中A，B，C是已知的并且解决a，b，c，d的值。以下是代码：

import tensorflow as tf
a = tf.Variable([.5])
b = tf.Variable([.5])
c = tf.Variable([.5])
d = tf.Variable([.5])
x = tf.placeholder(tf.float32)
y = tf.placeholder(tf.float32)
fn1 = 2*x**2+3*x+4 #A=2,B=3,C=4
fn2 = (a*x+b)*(c*x+d)
x_train = [1,2,3,4]
y_train = [9,18,31,48]
loss = tf.reduce_sum(tf.square(fn2-y))
optimizer = tf.train.GradientDescentOptimizer(0.01)
train = optimizer.minimize(loss)

init = tf.global_variables_initializer()
sess = tf.Session()
sess.run(init)

for i in range(1000):
  sess.run(train, {x:x_train, y:y_train})

print(sess.run([a,b,c,d]))

结果显示所有a，b，c和d的nan。怎么解决这个问题？我错过了什么？谢谢你的帮助。

Answer 1

您的成本函数未能以0.01的学习率收敛。将学习率设置为0.0001（或更低），并且成本函数开始收敛。

optimizer = tf.train.GradientDescentOptimizer(0.0001)

此外，如果您将fn2修改为a * x ** 2 + b * x + c，您将获得更接近Ax ^ 2 + Bx + C的解决方案。但是如果你使用（ax + b）（cx + d），你可能得到一个不同的解决方案，它将满足x = [1,2,3,4]的小训练数据集。

另一个小提示是不要将所有变量的相同值（在您的情况下为0.5）初始化。在-1.0到1.0之间随机初始化它。

当使用张量流来求解代数时，所有变量在训练后变为纳米

1 个答案: