使用PDFBox填写表单时如何替换丢失的字体?

时间:2018-05-30 16:24:59

标签: fonts pdfbox

我正在尝试使用PDFBox 2.0.8填写一堆PDF表单。对于某些文档,我在设置PDTextField的值时会出现以下错误:

java.io.IOException: Could not find font: /ArialMT

显然,字体未正确嵌入,这与专有Microsoft字体的情况一样。

如何告诉PDFBox替换字体,例如用“普通”Arial或其他字体?将字符串DA字符串设置为"/Helv 0 tf 0 g"会导致NullPointerException。

2 个答案:

答案 0 :(得分:1)

将“ArialMT”添加到默认资源:

try (PDDocument doc = PDDocument.load(new File("F2_Datenblatt_022015.pdf")))
{
    PDAcroForm acroForm = doc.getDocumentCatalog().getAcroForm();
    PDField field = acroForm.getField("Vorname_Name");

    // fails with IOException as described in question
    //field.setValue("Tilman Hausherr");

    // Method 1, just add type1 Helvetica (allows only WinAnsiEncoding glyphs)
    //acroForm.getDefaultResources().put(COSName.getPDFName("ArialMT"), PDType1Font.HELVETICA);

    // Method 2, add the full Arial font (allows for more different glyphs)
    // important: use the method that switches off subsetting
    acroForm.getDefaultResources().put(
        COSName.getPDFName("ArialMT"), 
        PDType0Font.load(doc, new FileInputStream("c:/windows/fonts/arial.ttf"), false));


    field.setValue("Tilman Hausherr");

    doc.save("F2_Datenblatt_022015-mod.pdf");
}

更新: 事实证明问题中的代码也会对文件起作用 - 差不多。它是“Tf”而不是“tf”,所以字符串将是“/ Helv 0 Tf 0 g”。我们将研究如何避免NPE并获得有意义的例外。

答案 1 :(得分:1)

基于Tilman Hausherr的评论,我构建了第一个独立于操作系统(在我的情况下是Linux)的修复程序。

acroForm.defaultResources.put(COSName.getPDFName("ArialMT"),
    PDType0Font.load (pdDocument, this.javaClass.classLoader.getResourceAsStream("fonts/ARIALMT.ttf"), false))

但这仅适用于此特定字体。什么仍然缺失 - 实际上是我的问题的主要意图 - 是一个选项告诉PDFBox回退到某个字体resp。 DA如果无法提供所需的字体。

蒂尔曼再次来救援后,我现在可以提出完整的解决方案。再次,这是Kotlin,而不是Java:

PDDocument.load(file).use { pdDocument ->
    val acroForm = pdDocument.documentCatalog.acroForm
    acroForm.defaultResources.put(COSName.getPDFName("ArialMT"),
            PDType0Font.load (pdDocument, this.javaClass.classLoader.getResourceAsStream("fonts/ARIALMT.ttf"), false))
    val pdField: PDField? = acroForm.getField(fieldname)
    val value = ...
    when (pdField) {
        is PDCheckBox -> {
            if (value is Boolean) {
                when (value) {
                    true -> pdField.check()
                    false -> pdField.unCheck()
                }
            } else {
                log.error("RENDER_FORM: Need Boolean for ${pdField.fullyQualifiedName} but got $value")
            }
        }
        is PDTextField -> {
            try {
                pdField.value = value?.toString() ?: ""
            } catch (ioException: IOException) {
                pdField.cosObject.setString(COSName.DA, "/Helv 0 Tf 0 g")
                pdField.value = value?.toString() ?: ""
                log.error("RENDER_FORM: Writing text field failed: ${ioException.message}")
            }
        }
        null -> {
            log.error("RENDER_FORMULAR: Formfield $fieldname does not exist in $name")
        }
        else -> log.error("RENDER_FORMULAR: Formfield $pdField ($fieldname) is of unhandled type ${pdField.fieldType}")
    }

    val stream = ByteArrayOutputStream()
    pdDocument.save(stream)
    pdDocument.close()
    return stream.toByteArray()
}