Question

因此，我一直在遵循Google的官方tensorflow指南，并尝试使用Keras构建一个简单的神经网络。但是，在训练模型时，它不使用整个数据集（具有60000个条目），而是仅使用1875个条目进行训练。有任何可能的解决方法吗？

import tensorflow as tf
from tensorflow import keras
import numpy as np

fashion_mnist = keras.datasets.fashion_mnist
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

train_images = train_images / 255.0
test_images = test_images / 255.0

class_names = ['T-shirt', 'Trouser', 'Pullover', 'Dress', 'Coat', 'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle Boot']

model = keras.Sequential([
                          keras.layers.Flatten(input_shape=(28, 28)),
                          keras.layers.Dense(128, activation='relu'), 
                          keras.layers.Dense(10)
])

model.compile(optimizer='adam',
              loss= tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])

model.fit(train_images, train_labels, epochs=10)

输出：

Epoch 1/10
1875/1875 [==============================] - 3s 2ms/step - loss: 0.3183 - accuracy: 0.8866
Epoch 2/10
1875/1875 [==============================] - 3s 2ms/step - loss: 0.3169 - accuracy: 0.8873
Epoch 3/10
1875/1875 [==============================] - 3s 2ms/step - loss: 0.3144 - accuracy: 0.8885
Epoch 4/10
1875/1875 [==============================] - 3s 2ms/step - loss: 0.3130 - accuracy: 0.8885
Epoch 5/10
1875/1875 [==============================] - 3s 2ms/step - loss: 0.3110 - accuracy: 0.8883
Epoch 6/10
1875/1875 [==============================] - 3s 2ms/step - loss: 0.3090 - accuracy: 0.8888
Epoch 7/10
1875/1875 [==============================] - 3s 2ms/step - loss: 0.3073 - accuracy: 0.8895
Epoch 8/10
1875/1875 [==============================] - 3s 2ms/step - loss: 0.3057 - accuracy: 0.8900
Epoch 9/10
1875/1875 [==============================] - 3s 2ms/step - loss: 0.3040 - accuracy: 0.8905
Epoch 10/10
1875/1875 [==============================] - 3s 2ms/step - loss: 0.3025 - accuracy: 0.8915

<tensorflow.python.keras.callbacks.History at 0x7fbe0e5aebe0>

这是我一直在研究的原始Google colab笔记本：https://colab.research.google.com/drive/1NdtzXHEpiNnelcMaJeEm6zmp34JMcN38

Answer 1

在拟合模型期间显示的数字1875不是训练样本；这是批次的数量。

model.fit包含可选参数batch_size，根据documentation：

如果未指定，则batch_size将默认为32。

所以，这里发生的是-您使用默认的批处理大小32（因为您没有指定其他任何东西），所以数据的批处理总数为

60000/32 = 1875

Answer 2

它不能对1875个样本进行训练。

Epoch 1/10
1875/1875 [===

1875这是步骤数，而不是样本。在fit方法中，有一个参数batch_size。它的默认值为32。 1875*32=60000这样。实现是正确的。

如果您使用batch_size=16进行训练，则自3750起，步数将是1875而不是60000/16=3750。

Answer 3

如果您希望整个 60000 个数据样本都可见，只需使用 batch_size = 1。

Keras不训练整个数据集

3 个答案: