我想从PDF文档中读取XMP元数据。我试图用PDFsharp(http://www.pdfsharp.net/)读取数据。大多数时候它运作良好,但在某些情况下我得到了这个例外:
Unhandled Exception: PdfSharp.Pdf.IO.PdfReaderException: Cannot handle iref streams. The current implementation of PDFsharp cannot handle this PDF feature introduced with Acrobat 6.
我在某处读到过这种情况在新版本中不会发生。所以我下载了PdfSharp 1.50.3638-beta(https://www.nuget.org/packages/PdfSharp/1.50.3638-beta)。
是的,现在我也不例外。但我的新问题是函数PdfReader.open不适用于某些文档。这意味着程序永远不会离开函数。
在某些论坛中,我读到它可能是由包含许多图像的大型文档引起的。所以我试着只阅读文件的信息:
PdfDocument pd = PdfReader.Open(s, PdfDocumentOpenMode.InformationOnly);
但它仍然无效。一些想法我如何阅读元数据?
答案 0 :(得分:2)
支持IRef流是PDFsharp 1.50 beta 的新功能,如果您有无法阅读的文件,请提交以供审核。