将合并的pdf拆分为单个文件

时间:2018-01-19 16:04:24

标签: pdf pdfsharp

我看到组合pdf文件可以拆分成多个文件的示例,但是可以通过基础文件的名称拆分合并的pdf文件。例如,组合pdf cp是通过组合文件a.pdf,b.pdf和c.pdf创建的。我想将组合的pdf cp拆分回其组件文件a.pdf,b.pdf和c.pdf。我看过pdfsharp,但我没有看到这样做的方法。不同的实用程序是否符合要求?

1 个答案:

答案 0 :(得分:1)

如果您也控制组合部分(换句话说,如果您自己生成合并的PDF),那么可能有一种方法。您可以将原始PDF文件的信息,范围和名称存储在生成的组合PDF文件中。

例如,您可以使用书签来存储此信息 如下所示:

private static void MergePdfs(string[] files, string outputFile)
{
    using (PdfDocument document = new PdfDocument())
    {
        foreach (string file in files)
            using (PdfDocument sourceDocument = PdfDocument.Load(file))
                foreach (PdfPage sourcePage in sourceDocument.Pages)
                {
                    PdfPage clonedPage = document.Pages.AddClone(sourcePage);
                    PdfOutline outline = document.Outlines.AddLast(Path.GetFileName(file));
                    outline.SetDestination(clonedPage, PdfDestinationViewType.FitPage);
                }

        document.Save(outputFile);
    }
}

然后您就可以检索该信息 如下所示:

private static void SplitPdfs(string inputFile, string outputFolder)
{
    using (PdfDocument document = PdfDocument.Load(inputFile))
    {
        PdfOutline outline = document.Outlines.First;
        PdfDocument destination = null;
        string file = null;
        int index = 0;

        do
        {
            if (file != outline.Title)
            {
                if(destination != null)
                {
                    destination.Save(Path.Combine(outputFolder, file));
                    destination.Close();
                }

                file = outline.Title;
                destination = new PdfDocument();
            }

            destination.Pages.AddClone(document.Pages[index++]);
            outline = outline.Next;
        }
        while (outline != null);

        destination.Save(Path.Combine(outputFolder, file));
        destination.Close();
    }
}

注意,代码使用GemBox.Pdf,您可以在此处找到mergesplit示例。
最后,可能有一种更智能的方式来存储必要的信息,但是这应该也可以,你可以尝试使用以下内容:

string[] pdfs = { "Sample1.pdf", "Sample2.pdf", "Sample3.pdf" };
string resultFile = "Result.pdf";

MergePdfs(pdfs, resultFile);

string resultFolder = Path.Combine(Path.GetDirectoryName(resultFile),
    Path.GetFileNameWithoutExtension(resultFile));
Directory.CreateDirectory(resultFolder);

SplitPdfs(resultFile, resultFolder);