如何在Python中区分扫描的PDF和本机PDF?

时间:2019-02-20 09:58:33

标签: python nlp

如何在Python中区分扫描的PDF和本机PDF?

因为两个文档的扩展名都只有PDF。

是否可以通过属性来查找文档是扫描的PDF还是本机PDF?

1 个答案:

答案 0 :(得分:1)

我不确定这些属性,但是如果缩放页面并且曲线仍然保持平滑-它是本机PDF,如果变得不均匀-将对其进行扫描,因为扫描的PDF仅是图像并且没有代码可以对其进行编辑。