我正在尝试编辑http://code.google.com/p/arc90labs-readability/的readability.js文件。
这是一个书签,通过剥离除网页/网页文章标题和正文之外的所有内容来“清理”当前页面。
但是,我想编辑脚本,以便当bookmarklet处于活动状态时,当前页面不会受到影响,而是将“已清理”的html文件输出到指定的本地目录。
有人可以帮忙吗?谢谢!
注意:干净的HTML文件名为“document.body.innerHTML”
答案 0 :(得分:1)
首先,如果不触摸原始页面就无法完成。脚本的工作方式,它编辑当前页面(所以图像URL继续工作,等等)。您可以做的最好的事情是存储根innerHTML
的{{1}},然后在抓取内容后将其恢复(或单独存储html
和head
)它看起来像这样:
body
元素的现有innerHTML
。html
或整个文档的HTML内容,并将其存储在变量中。此时,根据您的浏览器,您可以尝试使用dataURI,也可以动态添加对Downloadify库,图像等的引用,并将下载按钮添加到页面。最后,单击“下载”按钮,您可以预先提供步骤3中存储的文件名和数据,但每次都必须选择该位置。
对不起,这是假设的,但将这些放在一起需要相当多的工作。
答案 1 :(得分:0)
您实际上不需要修改可读性代码。只需拉出以下内容:
document.getElementById("readability-content");
然后,您可以将其传递到要保存的本地脚本。