删除Haskell中的HTML标记

时间:2015-06-25 13:49:40

标签: html haskell

我有一个字符串,如

<b>Vitamin A</b><br>Chloe Braided Halter Swim Top,

使用Text.HTML.TagSoup我试图删除所有的HTML并且只有

"Vitamin Chloe Braided Halter Swim Top" 
使用

import qualified Text.HTML.TagSoup as TS 
TS.parseTags "<b>Vitamin A</b><br>Chloe Braided Halter Swim Top,"

[TagText "<b>Vitamin A</b><br>Chloe Braided Halter Swim Top,"]

如何删除所有HTML标记?

1 个答案:

答案 0 :(得分:1)

是否必须与Text.HTML.TagSoup合作?似乎Hakyll.Web.Html会更合适:https://hackage.haskell.org/package/hakyll-4.1.2.1/docs/Hakyll-Web-Html.html

你有一个功能可以完成你想要的功能:

stripTags :: String - &gt; StringSource

从字符串中删除所有HTML标记