使用CGPDFScanner从PDF读取文本 - 这个PDF文件有什么问题?

时间:2015-04-17 08:36:02

标签: ios pdf character-encoding cgpdf cgpdfscanner

我正在尝试从此文件中提取文本:

https://www.dropbox.com/s/249snnj1nsve5ir/Lebenslauf.pdf?dl=0

使用CGPDFScanner。我可以从包含的PDF字典中检测到字符编码是WinAnsiEncoding,但字符都出现乱码。作为交叉检查,我尝试从Mac OS X中的预览应用程序复制粘贴文本,这是有效的 - 所以不知何故必须可以将其作为字符串提取。另一方面,商业第三方框架http://www.fastpdfkit.com也无法正确提取文本。

任何人都知道我错过了什么?

作为旁注,我使用https://github.com/KurtCode/PDFKitten来扫描PDF。

0 个答案:

没有答案