CNN OCR机器可读区域

时间:2019-03-20 20:20:36

标签: python tensorflow keras conv-neural-network

我正在训练卷积神经网络来识别智能手机上的MRZ(机器可读区域)字符。我想知道是否为了提高准确性我应该使用多种字体来训练它,即使MRZ仅使用OCR-B。此外,该模型在设备上执行的准确性与我用来训练/测试它的python代码中的准确性不同。有什么想法吗?

这是我正在使用的架构:

    model = Sequential()
    model.add(Convolution2D(filters=32, kernel_size=(3, 3), strides=(2, 2), activation='relu', input_shape=input_shape))
    model.add(MaxPooling2D(pool_size=(2, 2)))
    model.add(Dropout(0.5))
    model.add(Convolution2D(filters=64, kernel_size=(1, 1), strides=(1, 1), activation='relu'))
    model.add(MaxPooling2D(pool_size=(2, 2)))
    model.add(Dropout(0.2))
    model.add(Flatten())
    model.add(Dense(128, activation='relu'))
    model.add(Dense(num_classes, activation='softmax'))
    model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

1 个答案:

答案 0 :(得分:0)

如果MRZ仅使用一种字体,则应仅使用此字体来训练CNN。
为了提高效果,您应该在将图像传递到CNN之前对其进行预处理,例如,首先确定图像中的文本区域,然后再将它们传递通过CNN。

由于处理单元架构的原因,模型的准确性可能会在设备之间发生变化,例如,由于数值稳定性 ,CPU和GPU将获得不同的结果。