我是Haskell的初学者。 我有一些使用xml-conduit的代码,它运行良好,我可以根据需要进行转换。
let src_file = "blah.xhtml"
Document prologue root epilogue <- readFile def{psDecodeEntities=decodeHtmlEntities} src_file
let root' = transform root
-- And now we write out. Let's indent our output
writeFile def
{ rsPretty = True
} "output.xhtml" $ Document prologue root' epilogue
我遇到的问题是我的输入来自html(来自网络)。我想把它提供给我的功能。目前要做到这一点,我必须运行命令行实用程序'tidy'来将其规范化为XHTML:
tidy -output blah.xhtml -asxhtml blah.html
这是有效的,但显然不是很理想。我不想在'tidy'周围写一个命令行包装器,我相信这一定已经解决了!我找到了html-conduit包,但无法解决如何将一个连接到另一个。 如果有人能够阐明如何解决这个问题,或者另一个能够做我想做的图书馆,我将不胜感激。我尝试阅读html-conduit的文档,但无法弄清楚两个库如何互操作。