我目前正在研究xml架构,我们偶然发现了BasicLatin和Latin1Supplement中包含的精彩世界。
到目前为止,我们主要排除了U+0009
,U+000A
和U+000D
(即水平制表符,换行符和回车符)。我们问自己是否应该打扰排除其余的控制字符,即。如果我们不排除它们,是否有任何代表。
问题是:我们是否应该排除U+0000
和U+001F
以及U+0080
和U+00A0
以及U+007F
和U+00AD
之间的所有内容,或者只是不打扰并保持上面提到的三个?