使用Javascript查找Unicode字符名称

时间:2010-09-26 16:53:02

标签: javascript unicode character codepoint

当用户为其输入数字时,我需要找出Unicode字符的名称。一个例子是输入0041并得到“拉丁大写字母A”作为结果。

2 个答案:

答案 0 :(得分:4)

据我所知,没有一种标准的方法可以做到这一点。您可以解析UnicodeData.txt文件以获取此信息。

答案 1 :(得分:2)

这应该是你正在寻找的。第一个数组只是http://unicode.org/Public/UNIDATA/Index.txt,用|替换换行符;

// this mess..
var unc = "A WITH ACUTE, LATIN CAPITAL LETTER   00C1| /*... really big array ...*/ |zwsp    200B";
var uncs=unc.split("|");
var final_a = [];
var final_s = "";
for each (var item in uncs) {
    var _T=item.split("\t");
    //final_a [_T[1]] = _T[0];
    final_s += '"' + _T[1] + '"' + ' : ' + '"' + _T[0] + '",';
}

console.log (final_s);

// yields..

var unicode_lookup = { /*really big array*/ }

// which we can use like so ...

alert(unicode_lookup["1D01"]);
// AE, LATIN LETTER SMALL CAPITAL

SO不保留标签,因此如果您只是复制粘贴它,第一部分可能无效。您会注意到某些字符是重复的,因此您可能需要进行一些清理。