标签: python python-imaging-library ocr python-tesseract
我有一篇论文,其中的框包含要从中提取数据的字段。目前,我正在使用https://pypi.org/project/pytesseract/
特别是,我使用image_to_boxes提取数据,但是该程序从上至下,从左至右读取行,而不是从上至下从左至右读取框。所以我想知道是否可以解析数据表中某个区域的框内的数据。
结果显示为“零件操作:150编号:RG45X12-G” 而不是“部件号:RG45X12-G操作:150”