如何通过codePoint对JavaScript字符串进行排序?

时间:2017-03-09 16:01:16

标签: javascript sorting unicode

我希望通过包含unicode字符的字符串字段对对象进行排序。但是,我想按代码点排序字符串,而不是按语言环境排序。所以,这是一个例子,JavaScript对对象进行排序,以便\u24B7b被认为是相同的字符。

排序顺序不正确:

> [{name: 'a'}, {name: 'b'}, {name: 'd'}, {name: '\u24B7'}].sort((a,b)=> a.name.localeCompare(b.name))
[ { name: 'a' }, { name: 'b' }, { name: 'Ⓑ' }, { name: 'd' } ]

然而,这不是我想要的。我想要以下排序顺序,它们被认为是不同的字符。这是比较字符串而不包括比较器函数时的默认行为。

更正排序顺序(请注意,b\u24B7不再被视为相同的排序字符):

> ['a','b','\u24B7','d'].sort()
[ 'a', 'b', 'd', 'Ⓑ' ]

在实际应用程序中,字符串将包含多个字符,并且可能包含多个unicode字符,我们希望它们根据unicode编号(即代码点)进行排序。

我的问题:是否有一种简单的方法可以按字符串的代码点进行排序?我宁愿不为此重新实现自定义比较器。

1 个答案:

答案 0 :(得分:0)

我通常这样做:

let cmp = (a, b) => a > b ? 1 : a < b ? -1 : 0;

objects.sort((a, b) => cmp(a.name, b.name));

或者更确切地说

let sortBy = (a, f) => a.sort((x, y) => cmp(f(x), f(y)));

sortBy(objects, x => x.name);