将wiki转储解析为格式的适当方法是什么?

时间:2011-05-26 17:50:22

标签: java python parsing wiki dump

将wiki转储解析为包含自生成文章ID和文章内容的格式的最佳方法是什么?

文章ID将是一个引用ID,而内容是纯文本,没有url没有引用。