Question

从PDF中提取图片时遇到问题。我尝试使用GhostScript，但图像是用象素化的牙齿提取的，就像在物体边缘排列一样。我没有尝试改进它。增加DPI时，提取的图像太大。提取时会降低图像质量。

我很感激任何人推荐一个包来执行这样的操作 - 无论是付费还是免费。

Answer 1

有足够的通用PDF库可用于从PDF中提取图像。并非所有这些都提供了一种简单的方法。

作为Docotic.Pdf library的开发人员之一，我可以推荐它完成任务。

以下示例说明如何从PDF中提取所有图像：

static void ExtractImagesFromPdfPages()
{
    string path = "";
    using (PdfDocument pdf = new PdfDocument(path))
    {
        for (int i = 0; i < pdf.Pages.Count; i++)
        {
            for (int j = 0; j < pdf.Pages[i].Images.Count; j++)
            {
                string imageName = string.Format("page{0}-image{1}", i, j);
                string imagePath = pdf.Pages[i].Images[j].Save(imageName);
            }
        }
    }
}

图书馆不会重新取样图像。它将保存它们与PDF格式完全相同。

使用C＃从PDF中提取图像

1 个答案: