我是使用PHP进行PDF文档处理的新手。我有两个问题:
以PDF格式搜索图片:是否可以搜索PDF页面是否有图像?如果是这样,怎么样?
检查图像类型:如果图像中有图像,那么如何检查图像类型(我的意思是它是矢量还是其他类型)?
有人可以提出一些关于如何做到这一点的想法吗?
答案 0 :(得分:1)
无法从pdf中提取图像类型,无法知道图像类型 您可以从pdf中提取图像,然后使用php轻松检查图像类型 这里:How can I extract images from a PDF file?
答案 1 :(得分:1)
在#2上:通常,只能从PDF中可靠地提取位图图像。但并非总是如此:并非每个位图都是“图像”。例如,考虑一个位图字体或令人讨厌的Word子函数,它将符号字符作为8x8图像插入。有时,位图图像用作矢量对象的填充。
Acrobat Pro提供(提供?)命令“提取所有图像”,要求提供最小尺寸以防止创建大量不相关的小文件。
矢量图片只能在非常特定情况下提取。在大多数情况下,矢量数据与“常规”页面内容一起嵌入到页面中,因此形成图像的线条和在某些纯文本下绘制下划线的线条之间没有真正的区别。