此链接http://www.sil.org/iso639-3/download.asp和http://en.wikipedia.org/wiki/ISO_639:a中列出了7707种语言。
Unicode也支持语言的编写系统,但我想知道语言和unicode范围之间的映射。
Unicode范围列在此链接http://www.unicode.org/roadmaps/bmp/
中unicode范围的示例之一:“start”=> “0x0900”,“结束”=> “0x097F”,“block_name”=> “梵文”(什么语言使用这个范围的unicode?)
有任何文件吗?我需要在unicode范围内支持的完整语言映射。
答案 0 :(得分:0)
您可以查看ICU4C区域设置(http://icu-project.org/apiref/icu4c/uloc_8h.html)
您可以获取所有语言环境(使用uloc_getAvailable),然后为每个语言环境调用uloc_addLikelySubtags,然后在结果上使用uloc_getScript。
这将为您提供语言使用的最可能的脚本。但是有些语言使用多个脚本。其中一些被ICU捕获,但有些则没有。