DokuWiki下载器

时间:2011-02-21 13:46:56

标签: web-crawler documentation dokuwiki

我正在使用这个框架,它在DokuWiki中有文档。该框架的开发人员警告说,文档将消失,从而迫使用户切换到新版本的框架。

切换到新框架是不可能的,因为它需要代码重构......我的每个应用程序中的所有东西。因此,我需要下载他们的文档,我想用DokuWiki语法。

我有一个具有编辑页面权限的帐户,因此我可以看到每个页面的DokuWiki语法。

问题 :有没有办法抓取DokuWiki的所有页面并获取DokuWiki语法中的所有文章(当然有这样的权限)?


PS:作者拒绝提供所有DokuWiki(许可证不是原因),我不想使用任何网站下载程序。我只想要干净利落的DokuWiki语法,而不必手动遍历所有页面,编辑它们并保存源代码。

提前感谢您的帮助!

1 个答案:

答案 0 :(得分:5)

如果他们没有禁用?do = export_raw机制,您可以使用它来获取单个页面的原始wiki语法(参见http://www.dokuwiki.org/export)。

可以使用RSS提要(请参阅http://www.dokuwiki.org/syndication)或Google Sitemap(请参阅http://www.dokuwiki.org/sitemap)获取所有网页的列表。

将两者结合在一个小脚本中应该相对简单。