Question

我有数千张图片，其格式如这张图片https://imgur.com/7yjiW1N所示，我正在寻找一种将其转换为简单表的方法，其中✓= 1--= 0且✗= -1

我尝试过像Adobe这样的文本识别软件，但没有成功。现在，我正在考虑sklearn Python模块。到目前为止，我已经设法将图像加载到Python中并将其转换为numpy数组，并且我上传了一些正确的结果并将其也转换为数组（如下所示：[['0', '1', '1'], ['-1', '1', '1'], ... , ['0', '1', '1']]）

import csv
from PIL import Image
import numpy
im = Image.open("training_image.png")
training_data = numpy.array(im)
with open('correct_results.csv', 'rb') as f:
    correct_results = list(csv.reader(f))

对于我所看到的，sklearn进程似乎总是以相同的方式进行：

#Import a model: 
model=some_model()

#train it: 
model.fit(training_data,correct_results)

#predict:  
predicted_results=model.predict(new_input_data)

现在我想知道，如何将numpy数组转换为model.fit可以使用的形式，以及我可以使用哪种模型？到目前为止，我的研究还没有成功。

Python sklearn OCR用于使用特殊字符（✔和✗）进行调查的答案

0 个答案: