使用机器学习构建Python OCR

时间:2020-03-06 21:38:04

标签: python-3.x machine-learning ocr text-extraction

关于OCR和机器学习有很多问题,我正在寻找从头开始构建自己的指导。

我有几张淫秽的照片,其中包含与照片功能有关的文字。文本是要素的纬度,经度和ID。我正在寻找一种将这些信息提取到文本文件中以馈入GIS的方法。

我确信Tesseract和Pytesseract可以完全满足我的要求,但是我有一个阻碍,因为我无法在正在使用的PC上加载其他软件。

我的PC已连接到严格控制的安全网络。我无法安装新软件。但是,我可以使用移动热点“点安装”所需的任何Python库。我已经在Python中安装了Pytesseract库。但是,如果我了解这种依赖性,则需要先下载并安装Windows安装文件,然后才能运行。

因此,我决定尝试(作为辅助项目)使用Python和所需的任何库创建自己的OCR模型。唯一的问题是,在线上有大量信息,要找到一个重点突出且易于遵循的过程并不容易。

我正在寻找逐步详细说明资源的知识,我需要做些什么来创建训练数据集,训练模型并将图像输入到训练模型中以获得有意义的输出。

我一直在使用OpenCv处理图像(裁剪,过滤器等),以获取测试图像中所有可识别文本的边界框。我不确定从那里去哪里。

有没有推荐的在线完整教程/资源,对新手来说可能有意义?我正在使用Python 3.5。

0 个答案:

没有答案