我使用PDFBox等工具来解释PDF文件(包括文本,笔画,字形和图像),并可以访问流和词典。我不清楚这些组件如何链接在一起以及如何解释它们。特别是我想知道如何从流中访问字体。
注意:我对如何创建PDF文档的教程不感兴趣
答案 0 :(得分:1)
你可能应该从阅读PDF Reference开始。这是一个巨大的文件,但您可能只阅读相关部分。
要理解字体流,您基本上需要阅读TrueType和Type1字体格式(这也不是一个简单的阅读)。 PDF可能包含其他字体类型,但TrueType和Type1可能是最广泛使用的。
摆弄字体可能很复杂,因此您可能会发现使用某些字体库FreeType更容易从PDF字体流中提取信息。
答案 1 :(得分:1)
在planetpdf.com上有很多好文章,许多PDF开发人员使用有用的通用文章运行博客。我们的博客(http://www.jpedal.org/PDFblog/)
已经全力负责