用UTF-32字符清理JS中的字符串

时间:2015-05-05 10:40:40

标签: javascript utf-32

我需要从JS中的字符串中清除以UTF-32编码的字符,例如""。 我试图使用代码:

str.replace(/[^\u0000-\uFFFF]/gi, '')

但它不起作用。

1 个答案:

答案 0 :(得分:1)

对于我使用的干净信息

function fixedCharCodeAt(str, idx) {
  var code = str.charCodeAt(idx);
  if (0xD800 <= code && code <= 0xDBFF) { 
    // Upper auxiliary char
    var hi = code;
    var low = str.charCodeAt(idx+1);
    return ((hi - 0xD800) * 0x400) + (low - 0xDC00) + 0x10000;
 }
 if (0xDC00 <= code && code <= 0xDFFF) { 
   // Lower auxiliary symbol
    var hi = str.charCodeAt(idx-1);
    var low = code;
    return ((hi - 0xD800) * 0x400) + (low - 0xDC00) + 0x10000;
  }
  return code;
}

function cleaningMsgFromBreakingSymb(message_old) {
  var new_message = "";
  for (var i = 0, len = message_old.length; i < len; i++) {
    if (fixedCharCodeAt(message_old, i) < 65535){
        new_message += message_old[i];
    };
  };
  return new_message;
}