如何从pdf编码的identity-h获取文本

时间:2011-01-24 07:19:15

标签: objective-c ipad pdf

我成功使用TJ,Tj运算符Callbacks从pdf获取文本...但是仍然缺少一些文本身份编码的文本..如何将其转换为text / NSString ???

1 个答案:

答案 0 :(得分:2)

Identity-H编码意味着Type0字体(也称为CID键控字体),因此您必须参考嵌入式ToUnicode映射。您在TJ,Tj,单引号和双引号(四个文本显示运算符)中获得的字符不是unicode,而是在当前字体之外没有任何意义的任意字符ID。

PDF规范文档非常清晰,但阅读要求非常高。