我知道unicode包含来自大多数世界字母表的所有字符..但是数字呢?它们是否是unicode的一部分?我无法找到直接答案。 感谢
答案 0 :(得分:10)
如前所述,印度 - 阿拉伯数字(0,1,..,9)包含在Unicode中,继承自ASCII。如果你在谈论用其他语言表示数字,答案仍然是肯定的,它们也是Unicode的一部分。
//numbers (0-9) in Malayalam (language spoken in Kerala, India)
൦ ൧ ൨ ൩ ൪ ൫ ൬ ൭ ൮ ൯
//numbers (0-9) in Hindi (India's national language)
० १ २ ३ ४ ५ ६ ७ ८ ९
您可以在正则表达式中使用\p{N}
或\p{Number}
来匹配任何类型的numeric character in any script。
此document(第3页)描述了马拉雅拉姆语数字的Unicode代码点。
答案 1 :(得分:3)
简而言之:是的,当然。 UNICODE中有三个类别,包含各种数字和数字表示:
答案 2 :(得分:2)
Unicode points below 128与ASCII完全相同,所以,是的,它们在U + 0030到U + 0039(含)。
答案 3 :(得分:1)
他们是 - 代码点0030到0039,您可以看到,例如在decodeunicode.org上
顺便说一句,代码点0000-007E与ASCII相同(0-127,128 +不再是ASCII),所以您可以在Unicode中找到任何可以在Unicode中找到的内容。
答案 4 :(得分:1)
是的我这么认为: Information Taken From Here
U+0030 0 30 DIGIT ZERO
U+0031 1 31 DIGIT ONE
U+0032 2 32 DIGIT TWO
U+0033 3 33 DIGIT THREE
U+0034 4 34 DIGIT FOUR
U+0035 5 35 DIGIT FIVE
U+0036 6 36 DIGIT SIX
U+0037 7 37 DIGIT SEVEN
U+0038 8 38 DIGIT EIGHT
U+0039 9 39 DIGIT NINE
答案 5 :(得分:1)
你可以自己回答这个问题:如果它们不是Unicode的一部分,这会大大降低Unicode的实用性,你不觉得吗?
基本上,任何需要使用数字的文本都无法使用Unicode代码点表示。 (这假设您不会在一个文本中不同的字符编码之间来回切换:我不知道支持这种情况的单一软件/编程语言,并且有充分的理由。)
如果出现这样的问题,你非常需要阅读Joel Spolsky的The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)。认真。去读吧。