标签: python nlp
如何在Python中区分扫描的PDF和本机PDF?
因为两个文档的扩展名都只有PDF。
是否可以通过属性来查找文档是扫描的PDF还是本机PDF?
答案 0 :(得分:1)
我不确定这些属性,但是如果缩放页面并且曲线仍然保持平滑-它是本机PDF,如果变得不均匀-将对其进行扫描,因为扫描的PDF仅是图像并且没有代码可以对其进行编辑。