使用Aspose将PDF转换为Word

时间:2019-03-07 10:31:57

标签: java pdf ms-word aspose

在谈论pdf文件时,我对Aspose库有一个不好的认识:

enter image description here

我们的客户不接受冻结,他看到的字文件与原始办公室的字文件相同。 请问您有个主意吗?

1 个答案:

答案 0 :(得分:0)

请注意,默认情况下,原始PDF文件中每个按视觉分组的文本块都将转换为结果文档中的文本框。这样可以最大程度地将输出文档与原始PDF文件相似。输出文档看起来不错,但是它将完全由文本框组成,并且可能使在Microsoft Word中进一步编辑文档变得很困难。

请使用流识别模式获取无边界框的输出:

// Load source PDF file
Document doc = new Document( dataDir + "input.pdf");
// Instantiate Doc SaveOptions instance
DocSaveOptions saveOptions = new DocSaveOptions();
// Set output file format as DOCX
saveOptions.setFormat(DocSaveOptions.DocFormat.DocX);
// Set recognition mode
saveOptions.setMode(RecognitionMode.Flow);
// Save resultant DOCX file
doc.save( dataDir + "output.docx", saveOptions);

在此模式下,引擎执行分组和多级分析,以恢复原始文档作者的意图并生成最大程度可编辑的文档。缺点是输出文档的外观可能与原始PDF文件不同。

我们希望这会有所帮助。如果您需要任何进一步的帮助,请随时与我们联系。

PS::我与Aspose一起担任开发人员推广人员。