Itextsharp pdf解析

时间:2015-01-06 04:28:14

标签: itextsharp itext

为什么需要字体[FontName.afm]文件来解析PDF文件,而itextsharp可以解析所有PDF?

例如PDF文件包含fontface是new的文本,所以我的问题是它可以解析PDF文件中的文本而不提供[FontName] .afm文件

1 个答案:

答案 0 :(得分:1)

此问题已在SO和iText邮件列表上交叉发布。我正在将答案复制到SO上的邮件列表:

  

为什么在itextsharp库中需要字体文件[FontName.afm]

这些文件包含字体指标(AFM = Adob​​e字体指标)。需要它们来计算文本片段的尺寸(高度,宽度)。 iTextSharp附带的14个AFM文件与14种标准类型1字体相对应。这些是任何PDF查看器都应该能够呈现的字体,因此不需要嵌入这些字体(除非字体嵌入是必需的,例如在PDF / A的上下文中)。

请下载免费的电子书"The Best iText Questions on StackOverflow"并阅读有关字体的部分中的问题答案以获取更多信息。

另见:

  

如果没有这些字体文件,我们可以从PDF文件中提取文本吗?对于新引入的字体,itextsharp对于从PDF中提取文本非常有用吗?

您不需要AFM文件来提取文本,因为您需要的大多数信息(例如文档中使用的每个字形的宽度)都存储在文档中。 iTextSharp对于从PDF中提取文本很有用,但有时一般无法提取文本(无论您使用哪种工具)。有关详细说明,请观看此视频:https://www.youtube.com/watch?v=wxGEEv7ibHE

另见: