我正在使用这个框架,它在DokuWiki中有文档。该框架的开发人员警告说,文档将消失,从而迫使用户切换到新版本的框架。
切换到新框架是不可能的,因为它需要代码重构......我的每个应用程序中的所有东西。因此,我需要下载他们的文档,我想用DokuWiki语法。
我有一个具有编辑页面权限的帐户,因此我可以看到每个页面的DokuWiki语法。
问题 :有没有办法抓取DokuWiki的所有页面并获取DokuWiki语法中的所有文章(当然有这样的权限)?
PS:作者拒绝提供所有DokuWiki(许可证不是原因),我不想使用任何网站下载程序。我只想要干净利落的DokuWiki语法,而不必手动遍历所有页面,编辑它们并保存源代码。
提前感谢您的帮助!
答案 0 :(得分:5)
如果他们没有禁用?do = export_raw机制,您可以使用它来获取单个页面的原始wiki语法(参见http://www.dokuwiki.org/export)。
可以使用RSS提要(请参阅http://www.dokuwiki.org/syndication)或Google Sitemap(请参阅http://www.dokuwiki.org/sitemap)获取所有网页的列表。
将两者结合在一个小脚本中应该相对简单。