Apache Tika在后台使用Tesseract自动执行OCR。我正在使用Tika Server的/rmeta/xml
端点。效果很好:
curl -T /tmp/image.png http://localhost:9998/rmeta/xml --header "Accept: application/json" --header "Content-type: image/png"
但是我如何在选定的请求上禁用OCR ?
请注意,我不完全关闭OCR(如here所述)。我想随每个Tika Server文件请求动态地打开和关闭它。
我正在使用Tika-server 1.21和Tesseract 4.0.0。