IOS如何解码PDF CIDFontType2文本

时间:2012-05-04 04:18:41

标签: ios search pdf text

我想用中文搜索pdf中的文字。我正在使用CGPDFScanner。我无法使用CIDFontType2获取正确的文本。

我的字体对象有ToUnicode条目

fontName是 HFKAAO + LinGothic-Bold

它有CIDToGIDMap条目带有名称标识(pdf文件说它意味着truetype字体程序是嵌入式的)

CIDSystemInfo
注册表是Adobe
订购是身份

它在带有FlateDecode的FontDescriptor过滤器中有FontFile2条目

我发现有人说我只是夸大了我从Tj那里得到的文字,但这不起作用......我使用zlib来夸大文字,似乎它没有产生正确的数据。

我可以学习任何示例代码吗?

我刚刚找到https://github.com/KurtCode/PDFKitten,但它无法使用中文....

1 个答案:

答案 0 :(得分:0)

我发现了问题

我只是使用CMap翻译字符串形式Tj

我的代码中有一个错误,我解码了CMap

在我修复bug后,每件事都没问题

感谢〜