使用C#从PDF中提取图像

时间:2014-11-06 08:21:41

标签: c# pdf image-processing ghostscript

从PDF中提取图片时遇到问题。我尝试使用GhostScript,但图像是用象素化的牙齿提取的,就像在物体边缘排列一样。我没有尝试改进它。增加DPI时,提取的图像太大。提取时会降低图像质量。

我很感激任何人推荐一个包来执行这样的操作 - 无论是付费还是免费。

1 个答案:

答案 0 :(得分:2)

有足够的通用PDF库可用于从PDF中提取图像。并非所有这些都提供了一种简单的方法。

作为Docotic.Pdf library的开发人员之一,我可以推荐它完成任务。

以下示例说明如何从PDF中提取所有图像:

static void ExtractImagesFromPdfPages()
{
    string path = "";
    using (PdfDocument pdf = new PdfDocument(path))
    {
        for (int i = 0; i < pdf.Pages.Count; i++)
        {
            for (int j = 0; j < pdf.Pages[i].Images.Count; j++)
            {
                string imageName = string.Format("page{0}-image{1}", i, j);
                string imagePath = pdf.Pages[i].Images[j].Save(imageName);
            }
        }
    }
}

图书馆不会重新取样图像。它将保存它们与PDF格式完全相同。