我正在尝试从PDF文件中读取一些元数据,并且为此使用了PDFsharp。不幸的是,它似乎使创建者返回为UTF。
var reader = PdfReader.Open("data.pdf");
var creator = reader.Info.Creator; // þÿ\0M\0i\0c\0r\0o\0s\0o\0f\0t\0®\0 \0W\0o\0r\0d\0 \02\00\01\03
使用iTextSharp时,它可以正常工作,这表明文件不是问题。
var reader = new PdfReader("data.pdf");
var creator = reader.Info["Creator"]; // Microsoft® Word 2013
如何使用PDFsharp正确读取创建者?既然这似乎是一个编码问题,我觉得它应该是一个相对容易的解决方法,但我找不到它。
答案 0 :(得分:0)
我可以使用2013年以来的PDFsharp 1.32复制此行为。
我无法从2018年开始使用PDFsharp 1.50复制此行为。在过去五年的某个时间,此问题已得到解决。
使用最新版本的PDFsharp,您可以按预期访问元数据。现在,这很容易解决。遇到问题时总是先尝试使用最新版本是不错的主意。