在Python中使用MXNet预训练的图像分类模型

时间:2016-02-22 10:51:25

标签: python r machine-learning deep-learning mxnet

我试图在Python 3中为R所描述的所有内容做好准备。但到目前为止,我还没有进一步。

R中的教程如下所述:http://mxnet.readthedocs.org/en/latest/R-package/classifyRealImageWithPretrainedModel.html

我怎样才能在Python中做同样的事情?使用以下模型: https://github.com/dmlc/mxnet-model-gallery/blob/master/imagenet-1k-inception-bn.md

亲切的问候, 凯文

1 个答案:

答案 0 :(得分:1)

目前,您可以使用Python在mxnet中执行更多操作而不是使用R.我使用的是Gluon API,这使得编写代码更简单,并且允许加载预训练模型。

您引用的教程中使用的模型是Inception model。可以找到所有可用预训练模型的列表here

本教程中的其余操作是数据规范化和扩充。您可以对新数据进行规范化,类似于在API页面上对其进行规范化的方法:

image = image/255
normalized = mx.image.color_normalize(image,
                                      mean=mx.nd.array([0.485, 0.456, 0.406]),
                                      std=mx.nd.array([0.229, 0.224, 0.225]))

可能的扩充列表here

这是您的可运行示例。我只进行了一次扩充,如果你想做更多的参数,你可以向mx.image.CreateAugmenter添加更多参数:

%matplotlib inline
import mxnet as mx
from mxnet.gluon.model_zoo import vision
from matplotlib.pyplot import imshow

def plot_mx_array(array, clip=False):
    """
    Array expected to be 3 (channels) x heigh x width, and values are floats between 0 and 255.
    """
    assert array.shape[2] == 3, "RGB Channel should be last"
    if clip:
        array = array.clip(0,255)
    else:
        assert array.min().asscalar() >= 0, "Value in array is less than 0: found " + str(array.min().asscalar())
        assert array.max().asscalar() <= 255, "Value in array is greater than 255: found " + str(array.max().asscalar())
    array = array/255
    np_array = array.asnumpy()
    imshow(np_array)


inception_model = vision.inception_v3(pretrained=True)

with open("/Volumes/Unix/workspace/MxNet/2018-02-20T19-43-45/types_of_data_augmentation/output_4_0.png", 'rb') as open_file:
    encoded_image = open_file.read()
    example_image = mx.image.imdecode(encoded_image)
    example_image = example_image.astype("float32")
    plot_mx_array(example_image)


augmenters = mx.image.CreateAugmenter(data_shape=(1, 100, 100))

for augementer in augmenters:
    example_image = augementer(example_image)

plot_mx_array(example_image)

example_image = example_image / 255
normalized_image = mx.image.color_normalize(example_image,
                                      mean=mx.nd.array([0.485, 0.456, 0.406]),
                                      std=mx.nd.array([0.229, 0.224, 0.225]))