将PDF转换为基于XML的文件格式并保留布局和样式的最佳工具

时间:2012-02-23 13:55:18

标签: xml pdf text pdf-generation

我尝试过使用Adobe Acrobat X Pro,但其HTML导出功能仍然缺乏。一些明显粗体的文本不会保留。但我确实通过类似OCR的工具运行文档,并且能够在导出的word文档中保留样式。然后我把那个word文档导出为HTML。

有哪些最佳工具可以轻松地将PDF转换为HTML并保留样式和布局?

我听说Poppler非常好,但还没有尝试在我的Mac上编译它。

1 个答案:

答案 0 :(得分:0)

来自poppler的

pdftohtml - 但请务必获取最新版本。