我尝试使用Text.Pandoc将html文件解析为Text.Blaze.Html类型。 我试图解析的HTML是:
<head>
<style type="text/css">table.sourceCode {
margin: 0; padding: 0; vertical-align: baseline; border: none; }
table.sourceCode { width: 100%; line-height: 100%; background-color: #f8f8f8; }
</style>
<title>Using Yesod</title>
</head>
<body>
<h1>Intial Commit</h1>
<br>
</body>
我使用的代码是:
writeHtml def {writerHtml5 = True } . readHtml def $ inp
这会删除标题标记并仅生成给出的主体:
Main > renderHtml $ writeHtml def > {writerHtml5 = True } . readHtml def $ inp
"<h1>Intial Commit</h1>\n<p><br /></p>"
我理解标题内容存储为元数据,但我想知道Header内容的其余部分(在这种情况下样式信息)的位置。
Main > readHtml def ht
Pandoc (Meta {unMeta = fromList [("title",MetaInlines [Str "Using",Space,Str "Yesod"])]}) > [Header 1 ("",[],[]) [Str "Intial",Space,Str "Commit"],Para [LineBreak]]