以pdf格式导入命名目标

时间:2013-04-06 06:16:53

标签: c# pdf itextsharp

我正在开发一个应用程序,其中word文档以pdf格式转换。我的问题太复杂请帮帮我。

我的单词doc有一个toc,书签,尾注和超链接。当我将此文档另存为pdf时,只会转换书签。经过长时间的研究,我发现PDF文档不支持书签来书签超链接,它需要页码或命名目的地。

所以我为此目的选择了命名目的地,但我再次陷入困境,因为简单"save as“无法在pdf doc中生成命名目的地。所以我在adobe PDF打印机上打印doc这个词,我得到了命名目的地根据需要,但是这个文件既没有书签也没有超链接。所以我决定从一个单词生成两个pdf,首先是保存为选项,第二个是打印。

  1. test.pdf(另存为)(包含书签,超链接)
  2. test_p.pdf(通过打印)(仅包含命名目标)
  3. 然后我再次研究一下,找到了一种方法,通过itextsharp的函数将所有命名目的地从test_p.pdf提取到XML中。但遗憾的是,我没有办法在{{{{}}中导回这个xml。 1}}那就是我来这里的原因。

    如果这种方法没问题,请指导下一步该怎么做。否则建议我完成这项任务的任何方法。

1 个答案:

答案 0 :(得分:2)

我曾经写过一个类来替换我的PDF文件中的url:

using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using iTextSharp.text.pdf;

namespace ReplaceLinks
{
    public class ReplacePdfLinks
    {
        Dictionary<string, PdfObject> _namedDestinations;
        PdfReader _reader;

        public string InputPdf { set; get; }
        public string OutputPdf { set; get; }
        public Func<Uri, string> UriToNamedDestination { set; get; }

        public void Start()
        {
            updatePdfLinks();
            saveChanges();
        }

        private PdfArray getAnnotationsOfCurrentPage(int pageNumber)
        {
            var pageDictionary = _reader.GetPageN(pageNumber);
            var annotations = pageDictionary.GetAsArray(PdfName.ANNOTS);
            return annotations;
        }

        private static bool hasAction(PdfDictionary annotationDictionary)
        {
            return annotationDictionary.Get(PdfName.SUBTYPE).Equals(PdfName.LINK);
        }

        private static bool isUriAction(PdfDictionary annotationAction)
        {
            return annotationAction.Get(PdfName.S).Equals(PdfName.URI);
        }

        private void replaceUriWithLocalDestination(PdfDictionary annotationAction)
        {
            var uri = annotationAction.Get(PdfName.URI) as PdfString;
            if (uri == null)
                return;

            if (string.IsNullOrWhiteSpace(uri.ToString()))
                return;

            var namedDestination = UriToNamedDestination(new Uri(uri.ToString()));
            if (string.IsNullOrWhiteSpace(namedDestination))
                return;

            PdfObject entry;
            if (!_namedDestinations.TryGetValue(namedDestination, out entry))
                return;

            annotationAction.Remove(PdfName.S);
            annotationAction.Remove(PdfName.URI);

            var newLocalDestination = new PdfArray();
            annotationAction.Put(PdfName.S, PdfName.GOTO);
            var xRef = ((PdfArray)entry).First(x => x is PdfIndirectReference);
            newLocalDestination.Add(xRef);
            newLocalDestination.Add(PdfName.FITH);
            annotationAction.Put(PdfName.D, newLocalDestination);
        }

        private void saveChanges()
        {
            using (var fileStream = new FileStream(OutputPdf, FileMode.Create, FileAccess.Write, FileShare.None))
            using (var stamper = new PdfStamper(_reader, fileStream))
            {
                stamper.Close();
            }
        }

        private void updatePdfLinks()
        {
            _reader = new PdfReader(InputPdf);
            _namedDestinations = _reader.GetNamedDestinationFromStrings();

            var pageCount = _reader.NumberOfPages;
            for (var i = 1; i <= pageCount; i++)
            {
                var annotations = getAnnotationsOfCurrentPage(i);
                if (annotations == null || !annotations.Any())
                    continue;

                foreach (var annotation in annotations.ArrayList)
                {
                    var annotationDictionary = (PdfDictionary)PdfReader.GetPdfObject(annotation);

                    if (!hasAction(annotationDictionary))
                        continue;

                    var annotationAction = annotationDictionary.Get(PdfName.A) as PdfDictionary;
                    if (annotationAction == null)
                        continue;

                    if (!isUriAction(annotationAction))
                        continue;

                    replaceUriWithLocalDestination(annotationAction);
                }
            }
        }
    }    
}

使用它:

    new ReplacePdfLinks
    {
        InputPdf = @"test.pdf",
        OutputPdf = "mod.pdf",
        UriToNamedDestination = uri =>
        {
            if (uri.Host.ToLowerInvariant().Contains("google.com"))
            {
                return "entry1";
            }

            return string.Empty;
        }
    }.Start();

此示例将修改包含google.com的所有网址,以指向特定的指定目标“entry1”。 这是测试上述类的示例文件:

void WriteFile()
{
    using (var doc = new Document(PageSize.LETTER))
    {
        using (var fs = new FileStream("test.pdf", FileMode.Create))
        {
            using (var writer = PdfWriter.GetInstance(doc, fs))
            {
                doc.Open();
                var blueFont = FontFactory.GetFont("Arial", 12, Font.NORMAL, BaseColor.BLUE);
                doc.Add(new Chunk("Go to URL", blueFont).SetAction(new PdfAction("http://www.google.com/", false)));

                doc.NewPage();
                doc.Add(new Chunk("Go to Test", blueFont).SetLocalGoto("entry1"));

                doc.NewPage();
                doc.Add(new Chunk("Test").SetLocalDestination("entry1"));

                doc.Close();
            }
        }
    }
}