使用PdfSharp从Pdf获取XMP元数据

时间:2015-02-20 08:58:19

标签: c# pdf metadata pdfsharp xmp

我想从PDF文档中读取XMP元数据。我试图用PDFsharp(http://www.pdfsharp.net/)读取数据。大多数时候它运作良好,但在某些情况下我得到了这个例外:

Unhandled Exception: PdfSharp.Pdf.IO.PdfReaderException: Cannot handle iref streams. The current implementation of PDFsharp cannot handle this PDF feature introduced with Acrobat 6.

我在某处读到过这种情况在新版本中不会发生。所以我下载了PdfSharp 1.50.3638-beta(https://www.nuget.org/packages/PdfSharp/1.50.3638-beta)。

是的,现在我也不例外。但我的新问题是函数PdfReader.open不适用于某些文档。这意味着程序永远不会离开函数。

在某些论坛中,我读到它可能是由包含许多图像的大型文档引起的。所以我试着只阅读文件的信息:

PdfDocument pd = PdfReader.Open(s, PdfDocumentOpenMode.InformationOnly);

但它仍然无效。一些想法我如何阅读元数据?

1 个答案:

答案 0 :(得分:2)

支持IRef流是PDFsharp 1.50 beta 的新功能,如果您有无法阅读的文件,请提交以供审核。