我正在尝试使用pandoc将HTML转换为asciidoc,但是pandoc将<br>
标记转换为+\n
而不是\n
,如下所示。我也尝试了asciidoc-escaped_line_breaks,但没有任何改变。
终端命令:
`pandoc +RTS -K100000000 -RTS --wrap=preserve -f html -t asciidoc-escaped_line_breaks "input.html" -o "output.asciidoc"`
input.html
s
<br>
s
output.asciidoc
s +
s
预期输出:
s
s
版本:pandoc 1.19.2.4
答案 0 :(得分:2)
escaped_line_breaks
扩展名目前仅适用于降价促销,而不适用于AsciiDoc。
您可以使用如下所示的pandoc lua filter,从文档中剥离所有LineBreak
元素:
function LineBreak()
return {}
end
将其保存到例如strip-linebreaks.lua
。请注意,您的Pandoc版本真的很旧,您需要更新的版本才能使用lua过滤器。然后:
pandoc -f html --lua-filter strip-linebreaks.lua -t asciidoc