附有XML文件的PDF文件

时间:2010-04-23 16:55:49

标签: c# xml pdf

全部好,

我有一个附带xml的PDF文件,我需要解析xml文件。有谁知道我是怎么做到的? 我正在使用C#。

提前致谢。

3 个答案:

答案 0 :(得分:0)

按照LINQ to XML问题中的建议尝试使用this

答案 1 :(得分:0)

PDF文件可以包含元数据信息对象,还是作为对象嵌入的XML文件?

答案 2 :(得分:0)

我相信this blog post描述了如何使用C#从PDF文件中读取内容。

这是他从PDF中抓取文本的例子:

using System;
using org.pdfbox.pdmodel;
using org.pdfbox.util;

namespace PDFReader
{
class Program
{
    static void Main(string[] args)
    {
        PDDocument doc = PDDocument.load("lopreacamasa.pdf");
        PDFTextStripper pdfStripper = new PDFTextStripper();
        Console.Write(pdfStripper.getText(doc));
    }
}
}

Here看起来像是一个详尽且高度组织的如何使用C#阅读PDF的列表。

如果您需要的是某种形式的嵌入式元数据,正如Mark建议的那样,我确信使用我链接到的工具来获取也是可能的。