unicode中所有下标和变音符号的完整列表

时间:2011-12-29 01:33:22

标签: unicode xterm monospace

已回答:http://www.unicode.org/Public/UNIDATA/UnicodeData.txt是所有unicode字符的列表,而0xcc99#U + 0319 COMBINING RIGHT TACK BELOW有点像等长字体的逗号。(例如:10̡9̡8̡7̡6̡5̡4̡3̡2̡1̡0̡)

是否有a complete list of all unicode characters及其口头描述,例如一系列的行 ... 0xcc99#U + 0319以下组合权利 ..

特别是,我使用什么变音标记来输入1或2 o 3? 我的动机是希望能够添加一个点或逗号 终端中的 monospace 字体,不实际添加字符。

3 个答案:

答案 0 :(得分:2)

没有完整的所有Unicode字符列表及其口头描述,甚至没有带有Unicode名称的列表。 UnicodeData.txt文件通常引用大范围的字符,例如

4E00;<CJK Ideograph, First>;Lo;0;L;;;;;N;;;;;
9FCB;<CJK Ideograph, Last>;Lo;0;L;;;;;N;;;;;

AC00;<Hangul Syllable, First>;Lo;0;L;;;;;N;;;;;
D7A3;<Hangul Syllable, Last>;Lo;0;L;;;;;N;;;;;

有可能构建一个包含Unicode名称的完整列表,但目的是什么? Unicode名称(例如COMBINING PALATALIZED HOOK BELOW)是标识符,而不是描述。作为英文文本,其中一些是直观描述性的,一些是非常模糊的,一些是模糊的,一些是完全错误的 - 并且由于稳定性原则而永远不会改变。在程序中使用Unicode名称很大程度上需要这个原则;它们不得更改,原因与更改Unicode编号的原因相同。

变音符号的某些Unicode名称也具有误导性或至少不完整。变音符的形状不能仅从Unicode名称中推断出来,并且形状甚至可能变化很大(例如,caron是小写的ť,变音符看起来像conna,而相应的大写字母Ť有...好吧,像卡隆一样的卡通。)

在文本数据中使用U + 0319和U + 0321这样的字符意味着需要相对广泛的字体相对高级的渲染软件,它能很好地结合变音符号。此外,如果您打算在意义和背景中使用它们(它们不是用于语音符号,它们与字母相关联以表示发音的特征),您可能需要穷人不正确地实现它们的软件(考虑预期用途和渲染)。例如,U + 0319应该出现在下面一个字母

答案 1 :(得分:0)

是的,它可以在TUS附带的CD上找到,也可以从unicode.org下载:Unicode字符数据库。

答案 2 :(得分:0)

“我的应用程序如下:有时我在xterm的命令行中使用输出长数字的程序,我觉得难以阅读。所以我想使用变音符号来添加点或逗号,以便2938485860变为2.938.485.860并格式化保留了.U + 0321并不是真的好......“

如果您想为内联数字添加句点,则有一种方法可以实现。在unicode中,有一组"Enclosed Alphanumerics",其中包含带有尾随句点的数字。

2.938.485.860 - &gt; ⒉93⒏48⒌860

请注意,在终端中,这些可能无法读取。你也可以尝试

  • 2⑨38④85⑧60 - 每隔三位使用带圆圈的数字(丑陋)
  • 2938485860 - 使用 - 带下划线的字符
  • 2388560 - 将某些数字更改为“MATHEMATICAL SANS-SERIF BOLD DIGIT”