获取代码点的所有Unicode别名

时间:2016-06-06 17:48:36

标签: perl unicode

charnames pragma提供charnames::viacode,返回"最佳"给定代码点的名称

例如

$ perl -Mcharnames=:full -E'say charnames::viacode(ord "A")'
LATIN CAPITAL LETTER A

是否有方便的方法从Perl中发现此名称的所有已知别名?

1 个答案:

答案 0 :(得分:4)

要获取代码点的Unicode别名,可以使用以下命令:

use Unicode::UCD qw( charprop );

my @aliases =
   map { s/:.*//sr }
      split /,/,
         charprop($ucp, "Name_Alias");   # $ucp is the Unicode code point as a number.

例如,这会为U + 0020 SPACE返回SP

可以找到完整列表here

对于您可以传递给\N{}的所有值,请参阅here