我有一个字符串,如
<b>Vitamin A</b><br>Chloe Braided Halter Swim Top,
使用Text.HTML.TagSoup我试图删除所有的HTML并且只有
"Vitamin Chloe Braided Halter Swim Top"
使用
import qualified Text.HTML.TagSoup as TS
TS.parseTags "<b>Vitamin A</b><br>Chloe Braided Halter Swim Top,"
[TagText "<b>Vitamin A</b><br>Chloe Braided Halter Swim Top,"]
如何删除所有HTML标记?
答案 0 :(得分:1)
是否必须与Text.HTML.TagSoup
合作?似乎Hakyll.Web.Html
会更合适:https://hackage.haskell.org/package/hakyll-4.1.2.1/docs/Hakyll-Web-Html.html
你有一个功能可以完成你想要的功能:
stripTags :: String - &gt; StringSource
从字符串中删除所有HTML标记