标签: unicode
我正在寻找在真实自然文本中非组合之后出现的最大数量的unicode组合字符。
我知道在unicode文本中,可以在文本的任何位置放置任意数量的组合。但是,我正在编写一个必须在受限资源下运行的专用应用程序,并且由于其他技术原因,在非组合字符之后显示任意数量的组合字符不是一种选择。但是,如果可能的话,我仍然希望正确地显示自然语言,并且对少数组合的支持应该不是问题。
我的直觉是自然语言在适当的字符后不需要超过两三个组合,但我不确定并且找不到该数字的任何来源。