我的Google合作实验室在tiny-imagenet
上开始接受训练时,立即崩溃,其中包含10万张图像和200个大小为64 * 64的类
Colab日志显示
WARNING:root:kernel 1fe0be22-c98a-4519-a16a-69c9fb4be1da restarted
KernelRestarter: restarting kernel (1/5), keep random ports
tensorflow/stream_executor/dso_loader.cc:152] successfully opened CUDA library libcublas.so.10.0 locally
tensorflow/core/common_runtime/gpu/gpu_device.cc:1115] Created TensorFlow device (/job:localhost/replica:0/task:0/device:GPU:0 with 10754 MB memory) -> physical GPU (device: 0, name: Tesla K80, pci bus id: 0000:00:04.0, compute capability: 3.7)
我使用model.fit_generator
的批次大小(从32到1024尝试)和图像大小(从16到64尝试),但是没有任何效果。
我尝试了resnet-18
具有(1.8 * 10 ^ 9参数)的体系结构以及具有80万个参数的自定义模型,但是徒劳无功。
我将链接粘贴到我的合作实验室,以防有人需要其他信息 https://colab.research.google.com/drive/1QG1mg1zOn6gZaaSv4rrI4F6erdxsxQ8V#scrollTo=Uy0M-VDHivOX