MDN javascript文档供离线使用

时间:2012-02-29 15:28:08

标签: javascript html5 mozilla application-cache offline-browsing

我正在努力使MDN's Javascript Reference可供离线浏览(个人使用) 我不是网站的所有者也不是开发者,我只能访问其生成的输出。

我的第一个想法是在页面中注入HTML5 appcache.manifest;使用manifestR我生成了页面资源列表 然后我尝试使用file:///协议使用http://协议指向我的本地清单文件,最后使用base64 string表示文件的内容(data:text/cache-manifest,)。似乎没什么用。

谷歌搜索了一下之后,我偶然发现了public FTP。尚未完全抓取尚未。但是仍然没有找到 js docs 的任何提及。


  

我考虑使用浏览器的“另存为”命令保存HTML页面;但我宁愿开发一个基于javascript的爬虫,也不愿单独保存每一页。

在哪里可以找到MDN Docs的离线版本?或者如何在离线时浏览MDN文档?

5 个答案:

答案 0 :(得分:60)

https://mdn-downloads.s3-us-west-2.amazonaws.com/developer.mozilla.org.tar.gz

下载

"Downloading content" section of About MDN提供上述链接(用于tarball下载)以及有关访问MDN内容的其他方式的指导,包括单页和第三方工具。

和其他人一样:不要与wget& co,这给网站带来了不必要的压力,阻碍了其他用户。至少要确保https://developer.mozilla.org/robots.txt(要求温和节流)得到妥善处理。例如,Wget不会处理此问题(http://savannah.gnu.org/bugs/?30999)。

答案 1 :(得分:26)

JavaScript文档以及大多数MDN的网络参考页面都可在DevDocs上找到。

该应用是开源的,可以离线运行: https://github.com/Thibaut/devdocs

设置起来很简单,不需要抓取MDN。

答案 2 :(得分:6)

这看起来很有希望:https://github.com/rgarcia/dochub

这是一个一体化文档站点,可以安装在您自己的计算机上(需要节点),其中包含来自许多标准Web引用(包括MDN)的数据。它包含一个屏幕抓取器组件,它从MDN中提取信息,并相当快速地更新它(至少比上面提到的wget mirror命令快很多)。我还没有确认文档是如何完整的,但乍一看它们看起来很不错。

答案 3 :(得分:5)

如果您有Mac,则Dash(http://kapeli.com/dash)具有从Mozilla开发者网络生成的文档集,包括JavaScript。您也可以通过直接从http://kapeli.com/feeds/JavaScript.tgz下载文档集来避免使用Dash。

答案 4 :(得分:2)

下载wget并使用它来镜像doc:

wget -m -p https://developer.mozilla.org/en/JavaScript/Reference