Python sklearn OCR用于使用特殊字符(✔和✗)进行调查的答案

时间:2019-05-18 13:36:09

标签: python scikit-learn python-imaging-library ocr

我有数千张图片,其格式如这张图片https://imgur.com/7yjiW1N所示,我正在寻找一种将其转换为简单表的方法,其中✓= 1--= 0且✗= -1

我尝试过像Adobe这样的文本识别软件,但没有成功。 现在,我正在考虑sklearn Python模块。到目前为止,我已经设法将图像加载到Python中并将其转换为numpy数组,并且我上传了一些正确的结果并将其也转换为数组(如下所示:[['0', '1', '1'], ['-1', '1', '1'], ... , ['0', '1', '1']]

import csv
from PIL import Image
import numpy
im = Image.open("training_image.png")
training_data = numpy.array(im)
with open('correct_results.csv', 'rb') as f:
    correct_results = list(csv.reader(f))

对于我所看到的,sklearn进程似乎总是以相同的方式进行:

#Import a model: 
model=some_model()

#train it: 
model.fit(training_data,correct_results)

#predict:  
predicted_results=model.predict(new_input_data)

现在我想知道,如何将numpy数组转换为model.fit可以使用的形式,以及我可以使用哪种模型?到目前为止,我的研究还没有成功。

0 个答案:

没有答案