我一直在努力获得" softmax_cross_entropy_with_logits"作为147课程问题的成本函数的一部分。我的代码使用" sigmoid_cross_entropy_with_logits"但是想转向softmax。
我已经尝试了许多不同的尝试来通过从3级重新排名到2级(没有帮助)来获得代码,并且只是卡住了。我通过Notebook尝试了一些玩具代码,softmax_cross ....没有声明错误。还尝试将float32转换为float64(因为我的Notebook示例使用了64位并且工作正常)但仍然断言错误。
这是玩具代码:
y_hat_softmax = tf.nn.softmax(y_hat)
sess.run(y_hat_softmax)
# array([[ 0.227863 , 0.61939586, 0.15274114],
# [ 0.49674623, 0.20196195, 0.30129182]])
y_true = tf.convert_to_tensor(np.array([[0.0, 1.0, 0.0],[0.0, 0.0, 1.0]]))
sess.run(y_true)
# array([[ 0., 1., 0.],
# [ 0., 0., 1.]])
loss_per_instance_2 = tf.nn.softmax_cross_entropy_with_logits(y_hat, y_true)
sess.run(loss_per_instance_2)
# array([ 0.4790107 , 1.19967598])
cross_ent = tf.nn.softmax_cross_entropy_with_logits(y_hat, y_true)
print sess.run(cross_ent)
#[ 0.4790107 1.19967598]
print y_hat
#Tensor("Const:0", shape=(2, 3), dtype=float64)
print y_true
#Tensor("Const_1:0", shape=(2, 3), dtype=float64)
total_loss_2 = tf.reduce_mean(cross_ent)
sess.run(total_loss_2)
# 0.83934333897877922
这是我的代码片段:(大小在下面错误打印)
self.error0 = tf.nn.softmax_cross_entropy_with_logits(tf.to_double(self.outputSplit0), tf.to_double(self.YactSplit0), "SoftMax0")
self.error1 = tf.nn.softmax_cross_entropy_with_logits(self.outputSplit1, self.YactSplit1, "SoftMax1")
self.error = self.error0 + self.error1
我想要做的是我有2个编码的"字"对于每个结果,所以我现在试图单独计算每个单词的错误,但仍然无法正常工作。上面第一行出错:
self.outputSplit0 Tensor("LSTM/Reshape_2:0", shape=(8000, 147), dtype=float32)
self.YactSplit0 Tensor("LSTM/Reshape_4:0", shape=(8000, 147), dtype=float32)
Traceback (most recent call last):
File "modelbuilder.py", line 352, in <module>
brain.create_variables()
File "/home/greg/Model/LSTM_qnet.py", line 58, in create_variables
self.error0 = tf.nn.softmax_cross_entropy_with_logits(tf.to_double(self.outputSplit0), tf.to_double(self.YactSplit0), "SoftMax0")
File "/home/greg/tensorflow/_python_build/tensorflow/python/ops/nn_ops.py", line 1436, in softmax_cross_entropy_with_logits
precise_logits = _move_dim_to_end(precise_logits, dim, input_rank)
File "/home/greg/tensorflow/_python_build/tensorflow/python/ops/nn_ops.py", line 1433, in _move_dim_to_end
0, [math_ops.range(dim_index), math_ops.range(dim_index + 1, rank),
File "/home/greg/tensorflow/_python_build/tensorflow/python/ops/math_ops.py", line 1094, in range
assert all(arg.dtype in dtype_hierarchy for arg in [start, limit, delta])
AssertionError
任何想法可能会发生在这里?该错误似乎来自&#34;范围&#34;功能,只是无法弄清楚我做错了什么。
答案 0 :(得分:1)
传递给softmax函数的第三个参数隐式地被视为维度,但是您传递了名称,这导致断言被触发。您应该将参数的名称传递给函数:
int received = recvmsg(socket, &msgh, 0);
struct msghdr msgh;
struct cmsghdr *cmsg;
for (cmsg = CMSG_FIRSTHDR(msgh); cmsg != NULL; cmsg = CMSG_NXTHDR(msgh, cmsg)) {
if ((cmsg->cmsg_level == SOL_SOCKET ) &&(cmsg->cmsg_type == SO_TIMESTAMP ))
// read the timestamp
}