标签: python ocr tesseract python-tesseract
我正在使用Tesseract从图像文件中获取数据,但是我不确定如何将数据从2列数据分离为键(第一列)和值(第二列)。 / p>
Tesseract
如何将它们分开?
我的想法是使用NLTK处理和分离数据,或者使用Tesseract分离数据,然后返回结果,但是我不确定从哪里开始。
NLTK