我应该使用哪个Unicode符号子集来标记文本中的特殊子字符串?

时间:2014-08-16 19:41:30

标签: java unicode localization

我们的应用程序发送strings,然后将其client side本地化。有时这些是whole strings,有时只有substring,所以我们必须标记它们。如果它只使用Unicode,那将是最好的,因为它不需要任何协议更改。

示例:

"Length: (mark)10(mark)"

其中10是以cm为单位的长度,但应将其转换为显示为英寸或毫米 Unicode特殊字符(0xFFF0-0xFFFF)是否可以在文本中标记此类特殊子字符串?

1 个答案:

答案 0 :(得分:13)

不,Specials block中的代码点有自己的用途。将它们用于其他目的可能会导致意外的影响。即使您自己编写所有处理代码,传入的数据也可能包含这些代码点。当然可以检测它们并将它们过滤掉,但最好使用不能与任何指定代码点冲突的代码点。

使用U + FDD0..U + FDEF范围内的代码点。它们被指定为“非字符”,旨在用于应用程序内。请参阅Unicode常见问题解答部分Private-Use Characters, Noncharacters & Sentinels FAQ