替换字符串中的HTML实体,避免使用<img/>标记

时间:2013-10-24 21:51:40

标签: javascript jquery html regex

我有以下输入:

Hi! How are you? <script>//NOT EVIL!</script>

Wassup? :P

LOOOL!!! :D :D :D

然后通过表情符号库运行,它就变成了这个:

Hi! How are you? <script>//NOT EVIL!</script>

Wassup? <img class="smiley" alt="" title="tongue, :P" src="ui/emoticons/15.gif">

LOOOL!!! <img class="smiley" alt="" title="big grin, :D" src="ui/emoticons/5.gif"> <img class="smiley" alt="" title="big grin, :P" src="ui/emoticons/5.gif"> <img class="smiley" alt="" title="big grin, :P" src="ui/emoticons/5.gif">

我有一个逃避HTML entites的功能来阻止XSS。因此,在第一行的原始输入上运行它将产生:

Hi! How are you? &lt;script&gt;//NOT EVIL!&lt;/script&gt;

现在我需要逃避所有输入,但同时我需要保持表情符号处于初始状态。因此,如果有<:-P表情符号,它就会保持这种状态,并且不会成为&lt;:-P

我正在考虑对情感文本进行正则表达式分割。然后自己处理每个部分,然后将字符串连接在一起,但我不确定Regex被绕过的容易程度如何?我知道格式永远是这样的:

[<img class="smiley" alt="]
[empty string]
[" title="]
[one of the values from a big list]
[, ]
[another value from the list (may be matching original emoticon)]
[" src="ui/emoticons/]
[integer from Y to X]
[.gif">]

使用列表可能很慢,因为我需要在可能有20-30-40个表情符号的文本上运行该正则表达式。另外,可能需要处理5-10-15条短信。什么可以是一个优雅的解决方案?我准备使用第三方库或jQuery。 PHP预处理也是可能的。

1 个答案:

答案 0 :(得分:2)

也许这会对你有所帮助:

//TODO:Add the rest of emoticons here
var regExpEmoticons = /(\:P|\:\-P|\:D|\:\-D)/img;

function emoticonTag(title, filename) {
    return "<img class=\"smiley\" alt=\"\" title=\"" + title + "\" src=\"ui/emoticons/" + filename + "\">";
}

function replaceEmoticon(emoticon) {
    switch (emoticon.toUpperCase()) {
    case ':P':
    case ':-P':
        return emoticonTag("tongue, :P", "15.gif");
    case ':D':
    case ':-D':
        return emoticonTag("big grin, :D", "5.gif");
    //TODO: Add more emoticons
    }
}

function escapeHtml(string) {
    //TODO: Insert your HTML escaping code here
    return string;
}

function escapeString(string) {
    if (string == "") {
        return string;
    }
    var splittedString = string.split(regExpEmoticons);

    var result = "";
    for (var i = 0; i < splittedString.length; i++) {
        if (splittedString[i].match(regExpEmoticons)) {
            result += replaceEmoticon(splittedString[i]);
        } else {
            result += escapeHtml(splittedString[i]);
        }
    }
    return result;
}

您必须更改3个地方:

  1. 将所有表情符号添加到regExpEmoticons变量。
  2. 将所有表情符号添加到switch函数的replaceEmoticon语句中,或者将您的表情符号的整个函数更改为仅将表情符号字符串替换为包含该标记的HTML字符串。
  3. 将您的HTML转义代码添加到escapeHtml函数中,或将对此函数的调用更改为您正在使用的函数。
  4. 之后,如果你用你的字符串调用escapeString方法,我认为它会完成这项工作。