JODConverter&LibreOffice:将文档转换为带有嵌入式图像的html

时间:2019-04-02 14:13:10

标签: java libreoffice jodconverter

我正在使用JODConverter库(4.2.2)和LibreOffice(6.2)将doc / docx文件转换为html。我需要将图像保存为嵌入html文件中,但是默认情况下,它将保存在单独的文件中。

为了使用LibreOffice命令行界面执行此操作,我正在使用:

soffice --convert-to html:HTML:EmbedImages example.docx

我想知道是否有任何方法可以通过JODConverter库传递选项 EmbedImages

我的Java代码:

LocalConverter
    .make()
    .convert(new FileInputStream(docFile))
    .as(DefaultDocumentFormatRegistry.getFormatByMediaType(file.getMediaType().getName()))
    .to(htmlTempFile)
    .as(DefaultDocumentFormatRegistry.HTML)
    .execute();

1 个答案:

答案 0 :(得分:0)

这将起作用:

final DocumentFormat format =
    DocumentFormat.builder()
        .from(DefaultDocumentFormatRegistry.HTML)
        .storeProperty(DocumentFamily.TEXT, "FilterOptions", "EmbedImages")
        .build();

LocalConverter
    .make()
    .convert(new FileInputStream(docFile))
    .as(DefaultDocumentFormatRegistry.getFormatByMediaType(file.getMediaType().getName()))
    .to(htmlTempFile)
    .as(format)
    .execute();