有效的Unicode字符串

时间:2017-05-29 14:34:00

标签: unicode

我正在尝试用C ++学习unicode处理。我会使用UTF-8进行编码,但我的问题根本与编码无关。

问题很简单:是否有任何代码序列指向有效的unicode字符串?

我问这个问题的原因是因为Å可以表示为U+00C5或2个代码点的序列U+0041(A),U+030A(上面的环)。这让我想知道一个代码点U+030A(上面的环)的序列是否是一个有效的unicode字符串。事实证明,我已经能够在Linux下创建一个具有该名称的文件名,但我不确定它是否是一个有效的unicode字符串。

1 个答案:

答案 0 :(得分:0)

  

这让我想知道一个码点U+030A(环   上面没有任何内容,是一个有效的unicode字符串

问题无效,因为U+030A不是字符串而是代码点。但是,假设您确实将此代码点编码为正确的相关编码,如果此代码点单独出现则没有问题。它之前不需要任何东西。

  

事实证明,我已经能够使用该名称创建文件名   在Linux下

这并不意味着蹲下。