使用自定义字体结果提取文本结果不可读

时间:2016-06-10 17:33:49

标签: itext

我需要使用自定义字体从pdf扩展文本,但自定义不允许通过iText lib复制/粘贴文本或搜索文本或以清晰/可读方式提取文本...生成的文本是空格或非人类可读字符

pdf格式为: 作者:User Creator:Compart Docponent API Producer:Compart MFFPDF I / O Filter 2013-03-09 00:51:11 CreationDate:04/21/16 11:26:59 ModDate:06/09/16 10:02:16标签:无表格:无页数:6加密:否页面大小:595.2 x 841.92 pts(A4)(旋转0度)文件大小:312703字节优化:是PDF版本:1.4

pdf字体信息是(为每种字体运行pdffonts命令行):name:[none];类型:[类型3]; emb:[是]; sub:[no]; uni:[是];

所以pdf似乎有一个ToUnicode地图,但这还不够......

如何以清晰的方式阅读文字?

提前致谢

G.G。

0 个答案:

没有答案