我正在尝试使用MxNet Framework使用/ mxnet / example / image-classification / symbols目录中的alexnet代码。我不是AI的专家。有人可以解释如何使用GPU运行它吗?我尝试了以下单GPU:
python alexnet.py --network resnet --num-layers 110 --batch-size 128 --gpus 0
它没有做任何事情。我有HPC背景。我想测试每个节点和跨节点(分布式)的此框架的可伸缩性。任何帮助将不胜感激。
谢谢,
答案 0 :(得分:2)
alexnet.py(以及examples / image-classification / symbols文件夹中的其他Python文件)仅返回代表网络的符号。
首先下载并取消归档您的数据集:
/mxnet/example/image-classification/data# wget http://www.image-net.org/image/whatever-zip-or-tar-file
/mxnet/example/image-classification/data# unzip whatever-zip-or-tar-file
将数据格式转换为RecordIO:
/mxnet/example/image-classification/data# python ../../../tools/im2rec.py --list True --recursive True --train-ratio 0.95 mydata tiny-imagenet-200
/mxnet/example/image-classification/data# python ../../../tools/im2rec.py --num-thread 16 mydata tiny-imagenet-200
使用train_imagenet.py脚本在alexnet上训练(如果您愿意,可以切换到任何其他符号):
/mxnet/example/image-classification/data# cd ..
/mxnet/example/image-classification# python train_imagenet.py --network alexnet --data-train /mxnet/example/image-classification/data/mydata_train.rec --data-val /mxnet/example/image-classification/data/mydata_val.rec --num-layers 110 --batch-size 64 --gpus 0
请查看README了解详情。