将html解析为Text.Blaze.Html

时间:2015-01-02 13:14:52

标签: html haskell pandoc blaze-html

我尝试使用Text.Pandoc将html文件解析为Text.Blaze.Html类型。 我试图解析的HTML是:

<head>

 <style type="text/css">table.sourceCode {
 margin: 0; padding: 0; vertical-align: baseline; border: none; }
 table.sourceCode { width: 100%; line-height: 100%; background-color: #f8f8f8; }
 </style>

 <title>Using Yesod</title>

 </head>

 <body>
   <h1>Intial Commit</h1>
   <br>
 </body>

我使用的代码是:

writeHtml def {writerHtml5 = True } . readHtml def $ inp

这会删除标题标记并仅生成给出的主体:

Main > renderHtml $ writeHtml def > {writerHtml5 = True } . readHtml def $ inp
"<h1>Intial Commit</h1>\n<p><br /></p>"

我理解标题内容存储为元数据,但我想知道Header内容的其余部分(在这种情况下样式信息)的位置。

Main > readHtml def ht
Pandoc (Meta {unMeta = fromList [("title",MetaInlines [Str "Using",Space,Str   "Yesod"])]}) > [Header 1 ("",[],[]) [Str "Intial",Space,Str "Commit"],Para [LineBreak]]

0 个答案:

没有答案