我正在尝试使用稍后将用于解析的特定位置的分隔符来标记我的文本。我想使用最不常用的分隔符。我目前正在查看“\ 2”或U + 0002字符。这样安全吗?还有什么其他建议?该文本是unicode,将包含英文和非英文字符。
想要使用PHP仍然可以“爆炸()”的角色。
修改
此外,我希望能够在屏幕上(浏览器)显示这段文字,并且分隔符对用户来说是“不可见的”。我绝对可以使用str_replace()去掉可见的分隔符,但是如果有很好的不可见分隔符,那么就不需要这样的处理。
答案 0 :(得分:4)
如果仅用于内部表示(即不用于交换和存储),则可以使用非字符代码点,例如U + FFFF。 Java uses that as the signal that a CharacterIterator is done, for example