应用错误收集

摩门教徒在19世纪开发的Deseret alphabet是在BMP之外进行编码的，但是由在Unicode中被认为是字母的字符组成，而且与其他一些古代剧本不同，如Ugaritic或埃及象形文字，Deseret是一个套管脚本，意味着每个字母都有大写和小写的变体。

使用Deseret进行测试揭示了Java处理Unicode的一些缺陷。例如，s1.equalsIgnoreCase(s2)其中s1和s2是包含相同Deseret字母的大写和小写版本的字符串，返回false，因为equalsIgnoreCase方法无法正确处理代理项对。

编辑添加：我刚刚通过查看Unicode code charts：“Warang Citi”或维基百科拼写它"Varang Kshiti", the script of the Ho language来发现另一个。这是印度大约一百万人使用的一种语言的套文。

不区分案例的古代文字通常也不在BMP之内，例如Lydian，Phoenician和Aramaic。