使用POI从docx生成pdf时出错

时间:2017-07-06 13:14:31

标签: pdf docx docx4j xdocreport

我希望使用apache poi将docx转换为pdf,使用docx4j正确生成docx。使用简单文档进行转换工作正常,但是当我想转换更风格化的文档时,POI会抛出异常:

  

org.apache.xmlbeans.impl.values.XmlValueOutOfRangeException:union value'0000FF“> http://schemas.openxmlformats.org/wordprocessingml/2006/main'    15:09:20 org.apache.poi.xwpf.converter.core.XWPFConverterException:org.apache.xmlbeans.impl.values.XmlValueOutOfRangeException:union value'0000FF“> http://schemas.openxmlformats.org/wordprocessingml/ 2006 /主       在org.apache.poi.xwpf.converter.pdf.PdfConverter.doConvert(PdfConverter.java:70)〜[org.apache.poi.xwpf.converter.pdf-1.0.6.jar:1.0.6]

有这种例外的原因:

<w:r>
    <w:rPr>
        <w:rFonts w:ascii="Arial" w:hAnsi="Arial" w:cs="Arial"/>
        <w:color w:val="0000FF"><span style="background-color: rgb(51, 153, 102);"><span style="background-color: rgb(255, 0, 0);"><font color="99CC00"/>
        <w:sz w:val="20"/>
        <w:szCs w:val="20"/>
        <w:highlight w:val="red"/>
    </w:rPr>
    <w:t xml:space="preserve">Juillet-Aout</w:t>
</w:r>

Screen of my document

这是我的代码:

import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.InputStream;
import java.io.OutputStream;


import org.apache.poi.xwpf.usermodel.XWPFDocument;

import fr.opensagres.poi.xwpf.converter.pdf.PdfConverter;
import fr.opensagres.poi.xwpf.converter.pdf.PdfOptions;

public class ConvertDocxPdf
{

    public static void main( String[] args )
    {
        long startTime = System.currentTimeMillis();

        try
        {
            // 1) Load docx with POI XWPFDocument
            InputStream source = new FileInputStream("test.docx");
            XWPFDocument document = new XWPFDocument(source);

            // 2) Convert POI XWPFDocument 2 PDF with iText
            File outFile = new File("result.pdf" );
            outFile.getParentFile().mkdirs();

            OutputStream out = new FileOutputStream( outFile );
            PdfOptions options = null;// PDFViaITextOptions.create().fontEncoding( "windows-1250" );
            PdfConverter.getInstance().convert( document, out, options );
        }
        catch ( Throwable e )
        {
            e.printStackTrace();
        }

        System.out.println( "Generate DocxStructures.pdf with " + ( System.currentTimeMillis() - startTime ) + " ms." );
    }
}

这是导致问题的XML行:

<w:r>
    <w:rPr>
        <w:rFonts w:ascii="Arial" w:hAnsi="Arial" w:cs="Arial"/>
        <w:color w:val="0000FF"><span style="background-color: rgb(51, 153, 102);"><span style="background-color: rgb(255, 0, 0);"><font color="99CC00"/> //<-- That line
        <w:sz w:val="20"/>
        <w:szCs w:val="20"/>
        <w:highlight w:val="red"/>
    </w:rPr>
    <w:t xml:space="preserve">Juillet-Aout </w:t>
</w:r>

1 个答案:

答案 0 :(得分:0)

我无法在XDocReport网站和存储库中找到更新的预先构建的jar。我最终在Google上搜索我要查找的特定版本号,并在https://mvnrepository.com/artifact/fr.opensagres.xdocreport/fr.opensagres.poi.xwpf.converter.pdf/2.0.1

找到了它

我不确定这是否真的能回答这个问题,但它确实回答了如何获得该库的更新版本的相关问题。从源头构建可能更安全。