如何使用pandoc删除封闭标签并仅提取AST的分支?

时间:2017-05-05 02:41:48

标签: pandoc

我一直在研究pandoc过滤器。我想我已经得到它并做了一些教程但是我仍然无法绕过提取嵌入式身体标签并将其转换为div标签而删除所有封闭的用具

假设我有一个简单的html文件:

<html>
  <head> 
    <title>bla</title>
  </head>
  <body>
  Hello World
  </body>
</html>

我如何将其转换为

<div>
Hello World
<div>

1 个答案:

答案 0 :(得分:1)

要保留<body>代码等,只需在没有pandoc(又名--standalone)选项的情况下运行-s即可。如果您已查看pandoc filters,则您已经知道如何在需要的地方插入div

P.S。如果您查看pandoc document AST definition,您会发现它只是一些元数据和块元素列表。 <body>标签等都来自HTML template,而不是AST。