我正在尝试使用Boost在Python上优化我的程序,并用C ++函数替换一些Python代码。
Python代码:
from PIL import Image
for i in xrange(len(lines)):
im = Image.fromarray(lines[i])
line = pytesseract.image_to_string(im, "ukr+ukrb") # working to slow
C ++上的代码:
Pix *image = pixRead("/home/lucas63/Downloads/test.tif"); # here i need to get image directly from Python
api->SetImage(image);
outText = api->GetUTF8Text();
printf("OCR output:\n%s", outText);`
所以,我需要做两件事:
Boost.Python
将图像从Python发送到C ++。答案 0 :(得分:0)
您可以尝试使用包含tesseract的C ++ API的tesserocr:
import tesserocr
with tesserocr.PyTessBaseAPI(lang='ukr+ukrb') as api:
for l in lines:
im = Image.fromarray(l)
api.SetImage(im)
line = api.GetUTF8Text()
这将初始化API一次并使用它来处理多个图像。