PDF表格获取在线内容

时间:2015-06-06 10:40:12

标签: javascript pdf web-scraping adobe acrobat

是否可以在adobe pdf表单中使用内置的Javascript来获取内容/抓取网页?

当我用谷歌搜索,如果Javascript可以在那里CSP错误, 但据我所知,pdf表格没有这个。

感谢, G3

3 个答案:

答案 0 :(得分:0)

您可以使用wkhtmltopdf工具获取网站的HTML内容并将其保存为PDF

然后你可以简单地跑 rails_helper获取Google.com的内容并将其保存为PDF" google.pdf"。

答案 1 :(得分:0)

如您所料,使用Acrobat的Javascript扩展程序无法实现此目的。

有许多第三方工具可以将网站转换为PDF格式。如果您还需要构建表单,而不是仅仅转换网页,您可以编写一个利用第三方转换工具的程序,然后使用Acrobat Interapplication Communication API reference构建表单。如果您对Javascript更熟悉,您甚至可以使用PDDoc的JSObject来使用Javascript构建表单。

答案 2 :(得分:0)

有可能。查看“JavaScript for Acrobat API Reference”中的Net.HTTP方法。您可能会找到更新版本的参考here