Pandoc从Mediawiki转换为GFM

时间:2019-03-21 14:19:50

标签: mediawiki pandoc github-flavored-markdown

在尝试使用Pandoc将MediaWiki文件转换为GitHub Flavored Markdown时遇到的问题,我们有一些模板,如下所示:

{|cellspacing="0" cellpadding = "10" style="border-style:solid; border-color:black; border-width:1px;" width="100%"
| Some text....
|}

脚本失败,并显示以下错误:

Error at "source" (line 156, column 19):
unexpected "c"
expecting lf new-line, "!", "<" or "|"
{|cellspacing="0" cellpadding = "10" style="border-style:solid; border-color:black; border-width:1px;" width="100%"
                  ^
  • 工具 Pandoc 2.0.1.1
  • 从MediaWiki 1.21.2导出的
  • 输入 xml文件
  • 输出 Markdown文件
pandoc --from=mediawiki --to=gfm C:\Users\xxx\AppData\Local\Temp/pandoc5c93ace7d42b7

任何建议,谢谢您的支持。

1 个答案:

答案 0 :(得分:1)

Pandoc无法读取导出的XML,而只能读取实际的MediaWiki标记。标记是作为XML的一部分导出的,而如果要将其输入到pandoc中,则必须通过XML处理器将其提取。

寻找元素/mediawiki/page[ns=0]/revision/text(XPath)。