标签: xml pdf text pdf-generation
我尝试过使用Adobe Acrobat X Pro,但其HTML导出功能仍然缺乏。一些明显粗体的文本不会保留。但我确实通过类似OCR的工具运行文档,并且能够在导出的word文档中保留样式。然后我把那个word文档导出为HTML。
有哪些最佳工具可以轻松地将PDF转换为HTML并保留样式和布局?
我听说Poppler非常好,但还没有尝试在我的Mac上编译它。
答案 0 :(得分:0)
pdftohtml - 但请务必获取最新版本。
pdftohtml