将包含图形和表格的PDF文档转换为Word文档

时间:2017-08-23 07:33:34

标签: java

我正在尝试使用Java将PDF文档转换为Word文件。在Internet上,我找到了一个将PDF文档转换为Word的代码片段。但是生成的Word文档中的对齐方式很笨拙。图像表格和图形不同步。一切都显示为字符串段落/单词。

我写的代码如下。

XWPFDocument doc = new XWPFDocument();                         
String pdf = "D:\\xyz.pdf";            
PdfReader reader = new PdfReader(pdf);          
PdfReaderContentParser parser = new PdfReaderContentParser(reader);                         
for (int i = 1; i <= reader.getNumberOfPages(); i++) {              
TextExtractionStrategy strategy = (TextExtractionStrategy) 
parser.processContent(i,new SimpleTextExtractionStrategy());                
String text = strategy.getResultantText();                             
XWPFParagraph p = doc.createParagraph();                
XWPFRun run = p.createRun();                
run.setText(text);              
run.addBreak(BreakType.PAGE);

请有人帮忙.....

0 个答案:

没有答案