我有一个pdf文件:
通过Aspose.pdf转换为单词并输出:
https://ufile.io/ikwgx 为什么在从pdf转换为单词后,单词的文本超出了区域,并且文本采用组格式。
如何编辑此代码以实现我的目标?
我的代码是:
Document document = new Document("x"+".pdf");
document.save("x" + ".docx", SaveFormat.DocX);
答案 0 :(得分:0)
对于文本分组问题,我测试了这段代码并解决了我的问题:
DocSaveOptions saveOptions = new DocSaveOptions();
saveOptions.setMode(DocSaveOptions.RecognitionMode.Flow);
saveOptions.setFormat(DocSaveOptions.DocFormat.DocX);
document.save(Constants.EXP_DIR + token + ".docx", saveOptions);
但是对于表格问题以外的文字,我仍然有问题。