当使用tiny-imagenet-200数据训练模型(resnet18 / densenet)时,Google colab不断崩溃

时间:2019-03-28 10:11:13

标签: conv-neural-network google-colaboratory imagenet

我的Google合作实验室在tiny-imagenet上开始接受训练时,立即崩溃,其中包含10万张图像和200个大小为64 * 64的类

Colab日志显示

WARNING:root:kernel 1fe0be22-c98a-4519-a16a-69c9fb4be1da restarted
KernelRestarter: restarting kernel (1/5), keep random ports 
tensorflow/stream_executor/dso_loader.cc:152] successfully opened CUDA library libcublas.so.10.0 locally
tensorflow/core/common_runtime/gpu/gpu_device.cc:1115] Created TensorFlow device (/job:localhost/replica:0/task:0/device:GPU:0 with 10754 MB memory) -> physical GPU (device: 0, name: Tesla K80, pci bus id: 0000:00:04.0, compute capability: 3.7)

我使用model.fit_generator的批次大小(从32到1024尝试)和图像大小(从16到64尝试),但是没有任何效果。

我尝试了resnet-18具有(1.8 * 10 ^ 9参数)的体系结构以及具有80万个参数的自定义模型,但是徒劳无功。

我将链接粘贴到我的合作实验室,以防有人需要其他信息 https://colab.research.google.com/drive/1QG1mg1zOn6gZaaSv4rrI4F6erdxsxQ8V#scrollTo=Uy0M-VDHivOX

0 个答案:

没有答案