我想用中文搜索pdf中的文字。我正在使用CGPDFScanner。我无法使用CIDFontType2获取正确的文本。
我的字体对象有ToUnicode
条目
fontName是 HFKAAO + LinGothic-Bold
它有CIDToGIDMap
条目带有名称标识(pdf文件说它意味着truetype字体程序是嵌入式的)
CIDSystemInfo
注册表是Adobe
订购是身份
它在带有FlateDecode的FontDescriptor过滤器中有FontFile2条目
我发现有人说我只是夸大了我从Tj那里得到的文字,但这不起作用......我使用zlib来夸大文字,似乎它没有产生正确的数据。
我可以学习任何示例代码吗?
我刚刚找到https://github.com/KurtCode/PDFKitten,但它无法使用中文....
答案 0 :(得分:0)
我发现了问题
我只是使用CMap翻译字符串形式Tj
我的代码中有一个错误,我解码了CMap
在我修复bug后,每件事都没问题
感谢〜