MDN javascript文档供离线使用
-
14-11-2019 - |
题
我正在努力使 MDN的Javascript参考 可供离线浏览(个人使用)。
我不是网站的所有者也不是开发人员,我只能访问其生成的输出。
我的第一个想法是注入一个HTML5 appcache.manifest
在页面中 ;使用 舱单 我已经生成了页面资产的列表。
然后我尝试使用 file:///
协议,使用 http://
协议,最后使用一个 base64 string
, ,表示文件的内容(data:text/cache-manifest,
).似乎什么都不起作用。
在谷歌搜索了一下之后,我偶然发现了他们的 公共FTP.还没有完全爬过 然而.但仍然没有发现任何提及 js文档.
我已经考虑使用浏览器的另存为命令保存HTML页面;但我宁愿开发一个基于javascript的爬虫,而不是单独保存每个页面。
我在哪里可以找到mdn文档的离线版本?或 如何在离线状态下浏览MDN文档?
解决方案
下载于 https://mdn-downloads.s3-us-west-2.amazonaws.com/developer.mozilla.org.tar.gz
该 关于MDN的"下载内容"部分 提供上面的链接(用于tarball下载)以及其他访问MDN内容的方法的指导,无论是作为单个页面还是通过第三方工具。
和其他人 :不要与wget&co镜像,这是在网站上施加不必要的压力并阻碍其他用户。至少要确保 https://developer.mozilla.org/robots.txt (其中要求温和节流)得到妥善处理。例如,Wget不处理这个问题(http://savannah.gnu.org/bugs/?30999).
其他提示
JavaScript文档以及MDN的大多数web参考页面可在 发展文件.
该应用程序是开源的,可以离线运行:https://github.com/Thibaut/devdocs
它很容易设置,不需要刮MDN。
这看起来相当有希望: https://github.com/rgarcia/dochub
它是一个一体化的文档站点,可以安装在您自己的计算机上(需要节点),包含来自许多标准web引用的数据 包括MDN.它包含一个screen scraper组件,它从MDN中提取信息,并相当快地更新它(至少比上面提到的wget mirror命令快得多)。我还没有确认文档的完整程度,但乍一看它们看起来相当不错。
如果你有一台Mac,短跑(http://kapeli.com/dash)具有从Mozilla开发人员网络生成的docsets,包括JavaScript。您还可以通过直接从以下位置下载docset来避免使用Dash http://kapeli.com/feeds/JavaScript.tgz.
下载wget并使用它来镜像文档 :
wget-m-p https://developer.mozilla.org/en/JavaScript/Reference