使用javascript将HTML Character Entities转换回常规文本

时间:2010-12-02 19:27:35

标签: javascript character-entities

问题说明了一切:)

例如。我们有>,我们需要>仅使用javascript

更新:看来jquery是最简单的方法。但是,拥有轻量级解决方案会很不错。更像是一个能够自行完成的功能。

5 个答案:

答案 0 :(得分:27)

你可以这样做:

String.prototype.decodeHTML = function() {
    var map = {"gt":">" /* , … */};
    return this.replace(/&(#(?:x[0-9a-f]+|\d+)|[a-z]+);?/gi, function($0, $1) {
        if ($1[0] === "#") {
            return String.fromCharCode($1[1].toLowerCase() === "x" ? parseInt($1.substr(2), 16)  : parseInt($1.substr(1), 10));
        } else {
            return map.hasOwnProperty($1) ? map[$1] : $0;
        }
    });
};

答案 1 :(得分:19)

function decodeEntities(s){
    var str, temp= document.createElement('p');
    temp.innerHTML= s;
    str= temp.textContent || temp.innerText;
    temp=null;
    return str;
}

alert(decodeEntities('<'))

/*  returned value: (String)
<
*/

答案 2 :(得分:3)

这是一个&#34;类&#34;用于解码整个HTML文档。

HTMLDecoder = {
    tempElement: document.createElement('span'),
    decode: function(html) {
        var _self = this;
        html.replace(/&(#(?:x[0-9a-f]+|\d+)|[a-z]+);/gi,
            function(str) {
                _self.tempElement.innerHTML= str;
                str = _self.tempElement.textContent || _self.tempElement.innerText;
                return str;
            }
        );
    }
}

请注意,我使用Gumbo的正则表达式来捕获实体,但对于完全有效的HTML文档(或XHTML),您可以简单地使用/&[^;]+;/g

答案 3 :(得分:1)

我知道那里有库,但这里有几个浏览器解决方案。将html实体数据字符串放入您希望显示字符的人类可编辑区域(如textarea或输入[type = text])时,这些方法很有效。

我添加这个答案,因为我必须支持旧版本的IE,我觉得它包含了几天的研究和测试。我希望有人觉得这很有用。

首先这是针对使用jQuery的更现代的浏览器,请注意,如果您必须在10(7,8或9)之前支持IE版本,则不应该使用它,因为它将删除新行,只留下您一长串文字。

if (!String.prototype.HTMLDecode) {
    String.prototype.HTMLDecode = function () {
            var str = this.toString(),
            $decoderEl = $('<textarea />');

        str = $decoderEl.html(str)
            .text()
            .replace(/<br((\/)|( \/))?>/gi, "\r\n");

        $decoderEl.remove();

        return str;
    };
}

下一个是基于kennebec的上述工作,其中一些差异主要是为了旧的IE版本。这不需要jQuery,但仍需要浏览器。

if (!String.prototype.HTMLDecode) {
    String.prototype.HTMLDecode = function () {
        var str = this.toString(),
            //Create an element for decoding            
            decoderEl = document.createElement('p');

        //Bail if empty, otherwise IE7 will return undefined when 
        //OR-ing the 2 empty strings from innerText and textContent
        if (str.length == 0) {
            return str;
        }

        //convert newlines to <br's> to save them
        str = str.replace(/((\r\n)|(\r)|(\n))/gi, " <br/>");            

        decoderEl.innerHTML = str;
        /*
        We use innerText first as IE strips newlines out with textContent.
        There is said to be a performance hit for this, but sometimes
        correctness of data (keeping newlines) must take precedence.
        */
        str = decoderEl.innerText || decoderEl.textContent;

        //clean up the decoding element
        decoderEl = null;

        //replace back in the newlines
        return str.replace(/<br((\/)|( \/))?>/gi, "\r\n");
    };
}

/* 
Usage: 
    var str = "&gt;";
    return str.HTMLDecode();

returned value: 
    (String) >    
*/

答案 4 :(得分:0)

没有内置任何东西,但是已经编写了许多库来执行此操作。

Here就是一个。

here一个jQuery插件。