我看到组合pdf文件可以拆分成多个文件的示例,但是可以通过基础文件的名称拆分合并的pdf文件。例如,组合pdf cp是通过组合文件a.pdf,b.pdf和c.pdf创建的。我想将组合的pdf cp拆分回其组件文件a.pdf,b.pdf和c.pdf。我看过pdfsharp,但我没有看到这样做的方法。不同的实用程序是否符合要求?
答案 0 :(得分:1)
如果您也控制组合部分(换句话说,如果您自己生成合并的PDF),那么可能有一种方法。您可以将原始PDF文件的信息,范围和名称存储在生成的组合PDF文件中。
例如,您可以使用书签来存储此信息 如下所示:
private static void MergePdfs(string[] files, string outputFile)
{
using (PdfDocument document = new PdfDocument())
{
foreach (string file in files)
using (PdfDocument sourceDocument = PdfDocument.Load(file))
foreach (PdfPage sourcePage in sourceDocument.Pages)
{
PdfPage clonedPage = document.Pages.AddClone(sourcePage);
PdfOutline outline = document.Outlines.AddLast(Path.GetFileName(file));
outline.SetDestination(clonedPage, PdfDestinationViewType.FitPage);
}
document.Save(outputFile);
}
}
然后您就可以检索该信息 如下所示:
private static void SplitPdfs(string inputFile, string outputFolder)
{
using (PdfDocument document = PdfDocument.Load(inputFile))
{
PdfOutline outline = document.Outlines.First;
PdfDocument destination = null;
string file = null;
int index = 0;
do
{
if (file != outline.Title)
{
if(destination != null)
{
destination.Save(Path.Combine(outputFolder, file));
destination.Close();
}
file = outline.Title;
destination = new PdfDocument();
}
destination.Pages.AddClone(document.Pages[index++]);
outline = outline.Next;
}
while (outline != null);
destination.Save(Path.Combine(outputFolder, file));
destination.Close();
}
}
注意,代码使用GemBox.Pdf,您可以在此处找到merge和split示例。
最后,可能有一种更智能的方式来存储必要的信息,但是这应该也可以,你可以尝试使用以下内容:
string[] pdfs = { "Sample1.pdf", "Sample2.pdf", "Sample3.pdf" };
string resultFile = "Result.pdf";
MergePdfs(pdfs, resultFile);
string resultFolder = Path.Combine(Path.GetDirectoryName(resultFile),
Path.GetFileNameWithoutExtension(resultFile));
Directory.CreateDirectory(resultFolder);
SplitPdfs(resultFile, resultFolder);