全部好,
我有一个附带xml的PDF文件,我需要解析xml文件。有谁知道我是怎么做到的? 我正在使用C#。
提前致谢。
答案 0 :(得分:0)
按照LINQ to XML问题中的建议尝试使用this。
答案 1 :(得分:0)
PDF文件可以包含元数据信息对象,还是作为对象嵌入的XML文件?
答案 2 :(得分:0)
我相信this blog post描述了如何使用C#从PDF文件中读取内容。
这是他从PDF中抓取文本的例子:
using System;
using org.pdfbox.pdmodel;
using org.pdfbox.util;
namespace PDFReader
{
class Program
{
static void Main(string[] args)
{
PDDocument doc = PDDocument.load("lopreacamasa.pdf");
PDFTextStripper pdfStripper = new PDFTextStripper();
Console.Write(pdfStripper.getText(doc));
}
}
}
Here看起来像是一个详尽且高度组织的如何使用C#阅读PDF的列表。
如果您需要的是某种形式的嵌入式元数据,正如Mark建议的那样,我确信使用我链接到的工具来获取也是可能的。