使用PDFBox嵌入扁平化PDF表单的字体

时间:2018-12-29 09:29:54

标签: java pdf pdfbox pdf-form

我用PDFBox填写了PDF表单,在保存之前将其展平。表单具有用于文本和表单字段的自定义字体。当我在未安装此自定义字体的设备上打开输出文档(带有扁平化字段)时,普通文本的字体仍然正确,但是扁平化字段的字体显示为后备(?)字体。在已安装此自定义字体的设备上,所有内容均按预期显示。

扁平化表单后,是否可以对所有文本强制使用相同的自定义字体?

使用PDFBox填写PDF表单的代码(简体):

public class App
{
    public static void main(String[] args) throws IOException {
        String formTemplate = "src/main/resources/fonts.pdf";
        String filledForm = "src/main/resources/fonts_out.pdf";
        PDDocument pdfDocument = PDDocument.load(new File(formTemplate));
        PDAcroForm acroForm = pdfDocument.getDocumentCatalog().getAcroForm();
        acroForm.getField("text").setValue("Same font in form text field (updated with PDFBox)");
        acroForm.setNeedAppearances(true);
        acroForm.refreshAppearances();
        acroForm.flatten();
        pdfDocument.save(filledForm);
        pdfDocument.close();
    }
}

PDF: Input Output

预期:

Expected

系统上未安装字体时的结果:

Result when font is not installed on system

2 个答案:

答案 0 :(得分:2)

您的PDF的一些观察结果(上述编码问题都不存在-只是我的无知):

  1. SansDroid字体未嵌入到PDF中。通过将F2字体替换为新嵌入的F5字体,可以解决此问题。

  2. 已设置NeedAppearances标志,表示表单字段没有外观。任何读者都必须(重新)创建这些内容。拼合之前PDFBox不会自动完成此操作,因此我添加了这一部分

  3. 为了不再引起有关字体丢失的警告,我完全删除了F2字体。

  4. 我通过预检运行了原始PDF,它给了我以下警告:“ 缺少必需的键/ Subtype。路径:-> Pages-> Kids-> [0]-> Annots- > [0]-> AP-> N “该键确实存在,但似乎表明表单字段的外观存在错误。如果我删除了/ N dict,错误就消失了。流是“ / Tx BMC EMC”-也许缺少一些EOL?但是由于无论如何都会重新生成外观,所以错误随后消失了。

使用以下代码,将DroidSans字体嵌入到PDF中:

File pdf = new File("Fonts.pdf");
final PDDocument document = PDDocument.load(pdf);

FileInputStream fontFile = new FileInputStream(new File("DroidSans.ttf"));
PDFont font = PDType0Font.load(document, fontFile, false);

//1. embedd and register the font (Catalog dict)
PDAcroForm pDAcroForm = document.getDocumentCatalog().getAcroForm();
//create a new font resource
PDResources res = pDAcroForm.getDefaultResources();
if (res == null) res = new PDResources();
COSName fontName = res.add(font);
pDAcroForm.setDefaultResources(res);

//2. Now change the font of form field to the newly added font
PDField field = pDAcroForm.getField("text");
//field.setValue("Same font in form text field (updated with PDFBox)");

COSDictionary dict = field.getCOSObject();
COSString defaultAppearance = (COSString) dict.getDictionaryObject(COSName.DA);

if (defaultAppearance != null){
    String currentValue = dict.getString(COSName.DA);
    //replace the font - this should be improved with a more general version
    dict.setString(COSName.DA,currentValue.replace("F2", fontName.getName()));

    //remove F2 completely
    COSDictionary resources = res.getCOSObject();
    for(Entry<COSName, COSBase> resource : resources.entrySet()) {
        if(resource.getKey().equals(COSName.FONT)) {
            COSObject fonts = (COSObject)resource.getValue();
            COSDictionary fontDict = (COSDictionary)fonts.getObject();

            COSName toBeRemoved=null;
            for(Entry<COSName, COSBase> item : fontDict.entrySet()) {
                if(item.getKey().getName().equals("F2")) {
                    toBeRemoved = item.getKey();
                }
            }
            if(toBeRemoved!=null) {
                fontDict.removeItem(toBeRemoved);
            }
        }
    }

if(pDAcroForm.getNeedAppearances()) {
    pDAcroForm.refreshAppearances();
    pDAcroForm.setNeedAppearances(false);
}

//Flatten the document
pDAcroForm.flatten();

//Save the document
document.save("Form-Test-Result.pdf");
document.close();

请注意,上面的代码是完全静态的-搜索和替换名为F2的字体仅在提供的PDF上可用,在其他情况下则无效。您必须为此实现更通用的解决方案...

答案 1 :(得分:0)

PDFont font = PDType0Font.load(document, fontFile, false);

我想最后一个参数('false')将所有字符嵌入字体中。 当使用大字体(如日文字体)时,这将导致pdf很大。 因此,我尝试了以下代码,它对我有用。

(* Scala,PDFBox 2.0.20)

// val font = PDType0Font.load(document, fontFile, true);
// form.flatten()

// hack for embed minimul font?
val page = new PDPage(PDRectangle.A6) // any page size.
val stream = new PDPageContentStream(document, page)
stream.beginText()
stream.setFont(font, 0)
stream.showText(allChars) // `allChars` are inputed all characters in forms in the creating pdf.
stream.endText()
stream.close()
// NOTE: I did NOT add the page to the PDF but worked.  

// Save the document ~