在尝试使用Pandoc将MediaWiki文件转换为GitHub Flavored Markdown时遇到的问题,我们有一些模板,如下所示:
{|cellspacing="0" cellpadding = "10" style="border-style:solid; border-color:black; border-width:1px;" width="100%"
| Some text....
|}
脚本失败,并显示以下错误:
Error at "source" (line 156, column 19):
unexpected "c"
expecting lf new-line, "!", "<" or "|"
{|cellspacing="0" cellpadding = "10" style="border-style:solid; border-color:black; border-width:1px;" width="100%"
^
pandoc --from=mediawiki --to=gfm C:\Users\xxx\AppData\Local\Temp/pandoc5c93ace7d42b7
任何建议,谢谢您的支持。
答案 0 :(得分:1)
Pandoc无法读取导出的XML,而只能读取实际的MediaWiki标记。标记是作为XML的一部分导出的,而如果要将其输入到pandoc中,则必须通过XML处理器将其提取。
寻找元素/mediawiki/page[ns=0]/revision/text
(XPath)。