我是否需要从模式中允许的字符池中排除不可打印的控制字符?

时间:2018-03-09 08:00:17

标签: regex xsd

我目前正在研究xml架构,我们偶然发现了BasicLatin和Latin1Supplement中包含的精彩世界。

到目前为止,我们主要排除了U+0009U+000AU+000D(即水平制表符,换行符和回车符)。我们问自己是否应该打扰排除其余的控制字符,即。如果我们不排除它们,是否有任何代表。

问题是:我们是否应该排除U+0000U+001F以及U+0080U+00A0以及U+007FU+00AD之间的所有内容,或者只是不打扰并保持上面提到的三个?

0 个答案:

没有答案