使用粗体,文字大小

时间:2017-06-06 18:12:19

标签: pdf text formatting

我想知道是否有人可以指导我,我需要阅读pdf文件的文字,同时也获得格式。就像我不需要它是完全相同的格式,我只需要知道一些文本是否是粗体......以及文本的大小。

我可以在获取格式信息的同时阅读docx文件,因此如果有办法将pdf转换为也可以工作的doc / docx文件。

任何帮助都将受到高度赞赏

只要所需的资源可以在Linux服务器上运行,任何语言都可以。

我在阅读之前的帖子时已尝试过的事情:

  • PyPDF(无法获取格式)
  • PDF minner(无法获取格式)
  • FooLabs的Xpdf(再次没有获取任何格式的选项)
  • 使用shell脚本自动执行在Microsoft Word中打开pdf并将其另存为docx文件的过程(它可以工作......但对linux服务器不可行)

0 个答案:

没有答案