已回答:http://www.unicode.org/Public/UNIDATA/UnicodeData.txt是所有unicode字符的列表,而0xcc99#U + 0319 COMBINING RIGHT TACK BELOW有点像等长字体的逗号。(例如:10̡9̡8̡7̡6̡5̡4̡3̡2̡1̡0̡)
是否有a complete list of all unicode characters及其口头描述,例如一系列的行 ... 0xcc99#U + 0319以下组合权利 ..
特别是,我使用什么变音标记来输入1或2 o 3? 我的动机是希望能够添加一个点或逗号 终端中的 monospace 字体,不实际添加字符。
答案 0 :(得分:2)
没有完整的所有Unicode字符列表及其口头描述,甚至没有带有Unicode名称的列表。 UnicodeData.txt文件通常引用大范围的字符,例如
4E00;<CJK Ideograph, First>;Lo;0;L;;;;;N;;;;;
9FCB;<CJK Ideograph, Last>;Lo;0;L;;;;;N;;;;;
和
AC00;<Hangul Syllable, First>;Lo;0;L;;;;;N;;;;;
D7A3;<Hangul Syllable, Last>;Lo;0;L;;;;;N;;;;;
有可能构建一个包含Unicode名称的完整列表,但目的是什么? Unicode名称(例如COMBINING PALATALIZED HOOK BELOW)是标识符,而不是描述。作为英文文本,其中一些是直观描述性的,一些是非常模糊的,一些是模糊的,一些是完全错误的 - 并且由于稳定性原则而永远不会改变。在程序中使用Unicode名称很大程度上需要这个原则;它们不得更改,原因与更改Unicode编号的原因相同。
变音符号的某些Unicode名称也具有误导性或至少不完整。变音符的形状不能仅从Unicode名称中推断出来,并且形状甚至可能变化很大(例如,caron是小写的ť,变音符看起来像conna,而相应的大写字母Ť有...好吧,像卡隆一样的卡通。)
在文本数据中使用U + 0319和U + 0321这样的字符意味着需要相对广泛的字体和相对高级的渲染软件,它能很好地结合变音符号。此外,如果您打算在意义和背景中使用它们(它们不是用于语音符号,它们与字母相关联以表示发音的特征),您可能需要穷人不正确地实现它们的软件(考虑预期用途和渲染)。例如,U + 0319应该出现在下面一个字母
答案 1 :(得分:0)
是的,它可以在TUS附带的CD上找到,也可以从unicode.org下载:Unicode字符数据库。
答案 2 :(得分:0)
“我的应用程序如下:有时我在xterm的命令行中使用输出长数字的程序,我觉得难以阅读。所以我想使用变音符号来添加点或逗号,以便2938485860变为2.938.485.860并格式化保留了.U + 0321并不是真的好......“
如果您想为内联数字添加句点,则有一种方法可以实现。在unicode中,有一组"Enclosed Alphanumerics",其中包含带有尾随句点的数字。
2.938.485.860 - &gt; ⒉93⒏48⒌860
请注意,在终端中,这些可能无法读取。你也可以尝试