获取外部PDF中使用的嵌入字体列表

时间:2009-10-23 22:55:15

标签: java pdf itext

我一直在玩iText尝试获取外部PDF中使用的嵌入字体列表。我错过了什么或者这只是没有很好的记录?任何人都可以向我解释或建议替代方案吗?优先考虑字体名称和任何相关数据。

1 个答案:

答案 0 :(得分:0)

你有什么尝试?字体通常在与每个页面关联的字典中捕获,因此如果您抓取页面字典,然后查找字体的子字典等,您将找到它。

如果您有最新版本的iText(来自SVN的HEAD),请查看文本解析器。除了在页面上转储文本之外,还有一个工具,它还会转储字典结构,包括字体信息。

如果对“词典”等的讨论不清楚,您可能需要从至少简要阅读PDF规范开始(Adobe在其网站上有它)。您可能无法在iText中找到从页面获取字体的方法 - 但您可以获取字典,而在PDF中,字典定义所有内容(包括字体)