我正在为PDF文件编写解析器。应该将日期(例如 Info 对象的 CreationDate 条目)指定为类似于以下内容的文本:-
46
这很容易解析,我的解析器可以很好地处理它们。但是偶尔也有一些PDF文件似乎使用十六进制字符串格式指定日期,例如:-
(D:20190416162204+10'00')
PDF规范没有提及允许这种格式。如果将十六进制对转换为ASCII,则不会以以前的格式转换。有人遇到过这种格式的日期,知道如何解码吗?
答案 0 :(得分:1)
经过更多调查,结果表明日期和字符串可以加密,并且需要正确解密,才能将其视为最终字符串。 PDF的/ Trailer有一个/ Encrypt间接引用,需要进行处理才能设置您的解密例程。
答案 1 :(得分:-1)
实际上发生了PDF字符串为十六进制的情况,但是在您的情况下,字符串似乎是错误的(也许是由草率的pdf生成器创建的)