我正在尝试检测位于网格内的数字并告诉他们在图像中的位置,并且不知道从哪里开始。所以欢迎任何帮助。到目前为止,我已经使用了GT Text软件,但它没有解决目的。任何帮助函数,库,教程,链接或任何东西都是受欢迎的。
答案 0 :(得分:1)
你应该看看pytesseract模块:
https://pypi.python.org/pypi/pytesseract/0.1
它有一个单行代表你想要做的事情:
try:
import Image
except ImportError:
from PIL import Image
import pytesseract as tes
results = tes.image_to_string(Image.open('test.png'),boxes=True)
这将为您提供results
,其中包含每个数字及其边界框的图像坐标。
如果你有自制软件,你将需要安装PIL(python图像库,pip install PIL
)和tesseract c库(brew install tesseract
。)所以它不是超级琐碎但是一旦你有它工作,这是python中最直接的OCR,无需任何培训。