我正在努力使MDN's Javascript Reference可供离线浏览(个人使用) 我不是网站的所有者也不是开发者,我只能访问其生成的输出。
我的第一个想法是在页面中注入HTML5 appcache.manifest
;使用manifestR我生成了页面资源列表
然后我尝试使用file:///
协议使用http://
协议指向我的本地清单文件,最后使用base64 string
表示文件的内容(data:text/cache-manifest,
)。似乎没什么用。
我考虑使用浏览器的“另存为”命令保存HTML页面;但我宁愿开发一个基于javascript的爬虫,也不愿单独保存每一页。
在哪里可以找到MDN Docs的离线版本?或者如何在离线时浏览MDN文档?
答案 0 :(得分:60)
在https://mdn-downloads.s3-us-west-2.amazonaws.com/developer.mozilla.org.tar.gz
下载"Downloading content" section of About MDN提供上述链接(用于tarball下载)以及有关访问MDN内容的其他方式的指导,包括单页和第三方工具。
和其他人一样:不要与wget& co,这给网站带来了不必要的压力,阻碍了其他用户。至少要确保https://developer.mozilla.org/robots.txt(要求温和节流)得到妥善处理。例如,Wget不会处理此问题(http://savannah.gnu.org/bugs/?30999)。
答案 1 :(得分:26)
JavaScript文档以及大多数MDN的网络参考页面都可在DevDocs上找到。
该应用是开源的,可以离线运行: https://github.com/Thibaut/devdocs
设置起来很简单,不需要抓取MDN。
答案 2 :(得分:6)
这看起来很有希望:https://github.com/rgarcia/dochub
这是一个一体化文档站点,可以安装在您自己的计算机上(需要节点),其中包含来自许多标准Web引用(包括MDN)的数据。它包含一个屏幕抓取器组件,它从MDN中提取信息,并相当快速地更新它(至少比上面提到的wget mirror命令快很多)。我还没有确认文档是如何完整的,但乍一看它们看起来很不错。
答案 3 :(得分:5)
如果您有Mac,则Dash(http://kapeli.com/dash)具有从Mozilla开发者网络生成的文档集,包括JavaScript。您也可以通过直接从http://kapeli.com/feeds/JavaScript.tgz下载文档集来避免使用Dash。
答案 4 :(得分:2)
下载wget并使用它来镜像doc:
wget -m -p https://developer.mozilla.org/en/JavaScript/Reference