使用Javascript的表情符号代理字符串。如何解析?

时间:2015-11-13 03:55:53

标签: javascript file xmlhttprequest emoji surrogate-pairs

我想用javascript表达表情符号。 我有一个像......的文件。

:-),\ud83d\ude03
^^,\ud83d\ude03
^_^,\ud83d\ude03
:),\ud83d\ude03
:D,\ud83d\ude03

其中包含key和emoji代理值作为值。 我将阅读此内容,如果输入字符串与键匹配,请将该单词替换为表情符号。

即。类型“^^”将替换为笑脸标记。

但有一些奇怪的东西,如果我将这些信息作为对象,它会很好地打印表情符号。

像...

this.emojiStore.osx = {
                //smile
                ':-)' : '\ud83d\ude03'
                , '^^' : '\ud83d\ude03'
                , '^_^' : '\ud83d\ude03'
                , ':)' : '\ud83d\ude03'
                , ':D' : '\ud83d\ude03'
                //frawn
                , ':(' : '\ud83d\ude1e'
                //crying
                , 'T^T' : '\ud83d\ude22'
                , 'T_T' : '\ud83d\ude22'
                , 'ㅜㅜ' : '\ud83d\ude22'
                , 'ㅠㅠ' : '\ud83d\ude22'
                //poo 
                , 'shit' : '\ud83d\udca9'
        };

并替换部件看起来像......

this.value = emojiList[key];

但是当我从文件中读取信息时,它会打印字符串,如'\ ud83d \ ude22'。

如何用js表示代理字符串?(我不想使用第三方库。)

FYI,js文件和目标文件均使用UTF-8编码。

========文件加载部分

function loadFile(url){
    var ret = {};
    var rawFile = new XMLHttpRequest();
//    rawFile.overrideMimeType('text/html; charset=utf-8');
    rawFile.open("GET", url, false);
    rawFile.onreadystatechange = function (){
        if(rawFile.readyState === 4){
            if(rawFile.status === 200 || rawFile.status == 0) {
                var allText = rawFile.responseText;
                var textByLine = allText.split('\n');
                for(var i = 0; i < textByLine.length; i++){
                    if(textByLine[i].trim().length < 1) continue;
                    var key = textByLine[i].split(',')[0].trim();
                    var value = textByLine[i].split(',')[1].trim();
                    ret[key] = value;
                }
            }
        }
    };
    rawFile.send(null);
    console.log(ret);
    return ret;
}

===========已编辑

我找到了一个提示。

当我从文件中读取时,它会\u\\u,而当我从文本中读取它时,它会保持原样。

  • 文件版本:\ud83d\ude03\\ud83d\\ude03
  • 脚本版本:\ud83d\ude03本身

关键是如何阻止它将\更改为\\

我仍然找不到答案。

1 个答案:

答案 0 :(得分:1)

我发现了答案。

参考以下链接: How do I decode a string with escaped unicode?

function parseUnicode(str){
    var r = /\\u([\d\w]{4})/gi;
    str = str.replace(r, function (match, grp) {
        return String.fromCharCode(parseInt(grp, 16)); } );
    return str;
}

供参考,js String值可以与来自文件的字符串不同。我做了一个函数来检查每个字符,结果是不同的。

function charAnalyst(str){

    var result = '';
    for(var i = 0; i < str.length; i++){
        var aChar = str.charAt(i);
        result += aChar;
        console.log(aChar);
    }
    console.log(result);
}

我希望这会节省你的时间:D