应用错误收集

为什么我会为同一个 PDF 得到两种不同的像素大小？

时间：2021-04-01 18:55:50

标签： python-3.x azure pdf ocr python-camelot

我正在处理相同的 PDF，但获得了不同的像素大小。各种文档都是一样的。

当我使用 Azure 的 OCR 进行处理时，它会返回一个 JSON，其中包括：

"width": 1700,
"height": 2200,
"unit": "pixel",

但是当我使用读取 PDF 以提取文本的 Camelot（Python 库）进行处理时，它似乎是 600x800 像素。

差异是否与 DPI 有关？我需要让他们彼此同意以进行处理。

0 个答案:

没有答案