标签: pdf text formatting
我想知道是否有人可以指导我,我需要阅读pdf文件的文字,同时也获得格式。就像我不需要它是完全相同的格式,我只需要知道一些文本是否是粗体......以及文本的大小。
我可以在获取格式信息的同时阅读docx文件,因此如果有办法将pdf转换为也可以工作的doc / docx文件。
任何帮助都将受到高度赞赏
只要所需的资源可以在Linux服务器上运行,任何语言都可以。
我在阅读之前的帖子时已尝试过的事情: