我正在尝试使用Java将PDF文档转换为Word文件。在Internet上,我找到了一个将PDF文档转换为Word的代码片段。但是生成的Word文档中的对齐方式很笨拙。图像表格和图形不同步。一切都显示为字符串段落/单词。
我写的代码如下。
XWPFDocument doc = new XWPFDocument();
String pdf = "D:\\xyz.pdf";
PdfReader reader = new PdfReader(pdf);
PdfReaderContentParser parser = new PdfReaderContentParser(reader);
for (int i = 1; i <= reader.getNumberOfPages(); i++) {
TextExtractionStrategy strategy = (TextExtractionStrategy)
parser.processContent(i,new SimpleTextExtractionStrategy());
String text = strategy.getResultantText();
XWPFParagraph p = doc.createParagraph();
XWPFRun run = p.createRun();
run.setText(text);
run.addBreak(BreakType.PAGE);
请有人帮忙.....