我有数千张图片,其格式如这张图片https://imgur.com/7yjiW1N所示,我正在寻找一种将其转换为简单表的方法,其中✓= 1--= 0且✗= -1
我尝试过像Adobe这样的文本识别软件,但没有成功。
现在,我正在考虑sklearn Python模块。到目前为止,我已经设法将图像加载到Python中并将其转换为numpy数组,并且我上传了一些正确的结果并将其也转换为数组(如下所示:[['0', '1', '1'], ['-1', '1', '1'], ... , ['0', '1', '1']]
)
import csv
from PIL import Image
import numpy
im = Image.open("training_image.png")
training_data = numpy.array(im)
with open('correct_results.csv', 'rb') as f:
correct_results = list(csv.reader(f))
对于我所看到的,sklearn进程似乎总是以相同的方式进行:
#Import a model:
model=some_model()
#train it:
model.fit(training_data,correct_results)
#predict:
predicted_results=model.predict(new_input_data)
现在我想知道,如何将numpy数组转换为model.fit可以使用的形式,以及我可以使用哪种模型?到目前为止,我的研究还没有成功。