为什么需要字体[FontName.afm]文件来解析PDF文件,而itextsharp可以解析所有PDF?
即
例如PDF文件包含fontface是new的文本,所以我的问题是它可以解析PDF文件中的文本而不提供[FontName] .afm文件
答案 0 :(得分:1)
此问题已在SO和iText邮件列表上交叉发布。我正在将答案复制到SO上的邮件列表:
为什么在itextsharp库中需要字体文件[FontName.afm]
这些文件包含字体指标(AFM = Adobe字体指标)。需要它们来计算文本片段的尺寸(高度,宽度)。 iTextSharp附带的14个AFM文件与14种标准类型1字体相对应。这些是任何PDF查看器都应该能够呈现的字体,因此不需要嵌入这些字体(除非字体嵌入是必需的,例如在PDF / A的上下文中)。
请下载免费的电子书"The Best iText Questions on StackOverflow"并阅读有关字体的部分中的问题答案以获取更多信息。
另见:
如果没有这些字体文件,我们可以从PDF文件中提取文本吗?对于新引入的字体,itextsharp对于从PDF中提取文本非常有用吗?
您不需要AFM文件来提取文本,因为您需要的大多数信息(例如文档中使用的每个字形的宽度)都存储在文档中。 iTextSharp对于从PDF中提取文本很有用,但有时一般无法提取文本(无论您使用哪种工具)。有关详细说明,请观看此视频:https://www.youtube.com/watch?v=wxGEEv7ibHE
另见: