标签: python-3.x azure pdf ocr python-camelot
我正在处理相同的 PDF,但获得了不同的像素大小。各种文档都是一样的。
当我使用 Azure 的 OCR 进行处理时,它会返回一个 JSON,其中包括:
"width": 1700, "height": 2200, "unit": "pixel",
但是当我使用读取 PDF 以提取文本的 Camelot(Python 库)进行处理时,它似乎是 600x800 像素。
差异是否与 DPI 有关?我需要让他们彼此同意以进行处理。