应用错误收集

为什么使用张量流估计器高级API和原始API的mnist分类的交叉熵损失在规模上有所不同？

时间：2017-11-27 06:54:16

标签： python tensorflow

我正在阅读一些tensorflow示例代码，我发现CNN-using-estimatorAPI中的损失和raw CNN中的损失在规模上确实不同，但它们都是相同的损失函数：

前者是loss_op = tf.reduce_mean(tf.nn.sparse_softmax_cross_entropy_with_logits(logits=logits_train, labels=tf.cast(labels, dtype=tf.int32)))，它使用的是非热门标签。

后者是loss_op =tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=logits, labels=Y))，它使用单热矢量标签。

为什么前者损失接近0~2.39026，后者损失要大得多，为什么会这样？

0 个答案:

没有答案

用户级和内核级线程中的并发性。为什么产出不同？
使用高级语言有哪些缺点？
为什么使用张量流估计器高级API和原始API的mnist分类的交叉熵损失在规模上有所不同？
在收敛方面比较MSE损失和交叉熵损失
交叉熵和日志丢失错误有什么区别？
使用MNIST数据集的转移学习代码中的“文件名”是什么？
Tensorflow加权交叉熵损失函数在DNN分类器估算器函数中的哪个位置？
为什么svm在python和Matlab中的准确性不同？
CNN Pytorch（FashionMNIST）的火车损失和测试损失都很高
为什么在变分自动编码器中使用交叉熵计算损耗

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？