如何比较出现类似字符但不同字符代码的字符串?

时间:2016-10-09 21:18:06

标签: javascript string-comparison keycode

我遇到了将字符串与不同字符代码进行比较但类似字符的问题,如下所示:

console.log('³' === '3') // false;

由于不同的char代码,上面代码中的错误值:

console.log('³'.charCodeAt(0)) // 179
console.log('3'.charCodeAt(0)) // 51

将值转换为等于的通用解决方案是什么?我需要它,因为我需要比较所有数字,如1,2,3,4,5....

由于

2 个答案:

答案 0 :(得分:3)

查看ASCII折叠,主要用于将重音字符转换为非重音字符。它有一个JS库here

对于您提供的示例,它将起作用 - 对于其他示例,它可能不起作用。这取决于如何定义等价(没有人,但你知道你的意思"类似" - 不同的字符是不同的字符)。

如果您已经知道要映射的所有字符,最简单的方法就是自己定义映射:

var eqls = function(first, second) {
    var mappings = { '³': '3', '3': '3' };

    if (mappings[first]) {
        return mappings[first] == mappings[second];
    }

    return false;
}

if (eqls('³', '3')) { ... }

答案 1 :(得分:0)

没有"通用解决方案"

如果你只处理数字,你可能会建立你的等同表"对于每个支持的角色,您定义一个"规范"字符。

例如

var eqTable = []; // the table is just an array

eqTable[179] = 51; // ³ --> 3
/* ... */

然后构建一个简单的algorythm将字符串转换为规范形式

var original,         // the source string - let's assume original=="³3"
var canonical = "";   // the canonical resulting string

var i,
    n,
    c;

n = original.length;
for( i = 0; i < n; i++ )
{
    c = eqTable[ original.charCodeAt( i ) ];
    if( typeof( c ) != 'undefined' )
    {
        canonical += String.fromCharCode( c );
    }
    else
    {
        canonical += original[ i ]; // you *may* leave the original character if no match is found
    }
}

// RESULT: canonical == "33"