我有身份证(固定图像模板)。身分证是固定的模板,但相机以不同的光线,角度和变焦级别对其图像进行拍摄。
我本以为使用神经网络来检测文本行,并实际尝试了许多模型,例如text-detection-ctpn
,但它们报告的结果不理想。我将通过使用某些工具生成身份证图像来训练模型,因为数据集必须足够大而我的数据集还不够。此外,使用CPU(而非GPU)运行时NN的运行速度要慢得多
我现在正在考虑使用图像处理。 (例如,在opencv中,在经过调整和应用canny之后使用controus),但是问题是图像不同(如前所述)。
除了找到模板中固定的文本行之外,还有其他想法,例如HOG,SVM吗?