HTML网页到Wiki页面翻译

时间:2010-09-14 17:31:39

标签: html wiki

我正在寻找HTML to wiki网站翻译​​。基本上我想将cobertura生成的报道报告发布到我的谷歌代码网站。但谷歌代码只提供维基页面,所以如果有人可以指向我的HTML网站到维基页面(链接在一起)翻译我可以发布我的报道报道。

2 个答案:

答案 0 :(得分:2)

有一个非常好的翻译here。它还支持谷歌代码维基语法。

看看这是否可以帮助你。

答案 1 :(得分:2)

我不熟悉任何这样的翻译人员,但作为最后的手段,你自己破解一个快速的wiki标记DOM seralizer并不困难。

只需编写一个函数来使用DOM解析器解析HTML(我最喜欢的是libxml2的LXML Python绑定),并通过深度优先遍历序列化为wiki标记,然后将整个内容包装在现成的spidering框架中。 (或者鞭打你自己。这也不是太难。)

像这样的Python代码:(使用StackOverflow标记作为示例)

tags = {
    'b'       : {'start': '**', 'end': '**'},
    'em'      : {'start': '*', 'end': '*'},
    'i'       : {'start': '*', 'end': '*'},
    'strong'  : {'start': '**', 'end': '**'},
    // etc.
}

def serialize(node):
    tag = tags.get(node.tag, {})

    return ''.join([tag.get('start', ''), node.text or ''] +
                   [serialize(child) for child in node] +
                   [tag.get('end', ''), node.tail or ''])

wiki_markup = serialize(domRoot)

这花了我5分钟,我可能在一小时内完成整个事情。

我省略了处理块标记的更复杂的位(换行符,缩进或行起始字符很重要的内容)和脚注式链接定义,但这并不是很难...特别是如果你添加一个可选的标记定义结构的回调参数。

真的,唯一耗时的部分是重新发明Makefile风格“只更新已更改的内容”缓存。