我正在尝试用C ++学习unicode处理。我会使用UTF-8
进行编码,但我的问题根本与编码无关。
问题很简单:是否有任何代码序列指向有效的unicode字符串?
我问这个问题的原因是因为Å可以表示为U+00C5
或2个代码点的序列U+0041
(A),U+030A
(上面的环)。这让我想知道一个代码点U+030A
(上面的环)的序列是否是一个有效的unicode字符串。事实证明,我已经能够在Linux下创建一个具有该名称的文件名,但我不确定它是否是一个有效的unicode字符串。
答案 0 :(得分:0)
这让我想知道一个码点
U+030A
(环 上面没有任何内容,是一个有效的unicode字符串
问题无效,因为U+030A
不是字符串而是代码点。但是,假设您确实将此代码点编码为正确的相关编码,如果此代码点单独出现则没有问题。它之前不需要任何东西。
事实证明,我已经能够使用该名称创建文件名 在Linux下
这并不意味着蹲下。