我有一个PDF,我正在尝试使用CGPDFScanner扫描PDF。 在扫描pdf时,单词" file"遇到,CGPDFStringGetBytePtr API返回" \ x02le"。 PDF具有Type1字体而没有ToUnicodeMapping(CMap)。编码字典不存在于PDF中,因此使用NSUTF8String编码。但是我已经尝试了所有NSMacOSRomanStringEncoding,NSASCIIStringEncoding但没有运气。 可能是什么问题?
感谢。
答案 0 :(得分:2)
code \ x02对应'fi'字符串。 'fi'序列是使用结扎线绘制的,这就是为什么你只有一个字符代码 代码和字符串之间的对应关系是以字体编码完成的。字体编码包含/ Differences数组,用于指定code \ x02和序列'fi'
之间的映射