在录制序列后的ITPilot中,我必须截取一个Pdf文档。我能够将pdf转换为HTML,并且生成的HTML不是完全格式化的。这导致提取器未完全按需接收字段。 有人可以帮助将pdf转换为我面临问题的Acrobat HTML(或)帮助我在浏览器视图中截取未格式化的HTML。
答案 0 :(得分:0)
要在Adobe Acrobat中使用CONVERTPDFTOHTML功能,必须安装Professional版本: " ACR_HTML:配置命令以使用HTML转换器 Adobe Acrobat Professional软件(必须安装此产品)。"
关于PDFBox的问题,在分配here
中所述的示例时,您可能遇到与缩放页面相关的常见问题