我正在构建一个Web应用程序,用户可以在其中构建从其他网页提取内容的自定义网页。我知道这样做的几个选项,我不确定哪个是最好的,如果有更好的解决方案。现在,我可以:
有没有人这样做过,或者有没有人有任何想法?
答案 0 :(得分:1)
最干净的解决方案是从http请求服务器端发送,然后根据需要将html呈现到您的页面中,这还需要将所有内容和链接的URL更改为绝对
例如:
<img src="\images\banner.png">
将在远程服务器上运行,但一旦进入页面,图像将不存在。最可行的解决方案是限制图像和链接的功能,然后使用正则表达式进行查找/替换以匹配相对URL并将源地址添加到其中。
如果您要从服务器重新发送其他人的内容,即使只是html,您也会遇到法律问题。
使用iframe将是快速的脏解决方案,并且可能具有最少的法律后果,因为浏览器向网站发送内容的正常请求。
答案 1 :(得分:0)
我建议使用DocRaptor从HTML生成PDF文件。它的工作方式与wkhtmltopdf类似,但可生成功能齐全的PDF文件。
以下是其主页的链接:
其API文档的链接: