将HTML实体解码为纯文本

时间:2018-11-12 19:10:11

标签: vba string ascii

我有一个包含HTML entities的字符串(例如±-减号)。

如何获得将那些HTML实体解码为纯文本的字符串?

示例:

 Input          |  Output
----------------+-------------
±        |    ±
Ben & Jerry | Ben&Jerry

1 个答案:

答案 0 :(得分:0)

您可以创建一个HTMLDocument对象,将HTML存储在其中,并从中获取其文本版本:

Function HtmlDecode(str)
    Dim dom

    Set dom = CreateObject("htmlfile")
    dom.Open
    dom.Write str
    dom.Close
    HtmlDecode = dom.body.innerText
End Function

decoded = HtmlDecode("±")   ' =  "±"