加入分离的字形集群

时间:2017-08-05 14:23:05

标签: unicode utf-8 character-encoding utf-16 ligature

我有一些缅甸语文本,它被拆分为单个字符,以检查和删除相关Unicode块之外的字符,例如从缅甸语中删除拉丁字符。结果(如果我使用正确的术语)是字形集群已经分开如下:

ေမာင္ေကာင္းၫိႈ႕မွဴးႏိုင္

我相信虚线圆圈的位置应该是两个字符作为一个Unicode字符而不是两个。

正确渲染缅甸语不应该像这样的虚线圆圈:

ယနေ့ မြန်မာမှုအဖြစ် ပုံဖော်ပေးခဲ့သည့် ယဉ်ကျေးမှုမှာ နှစ်ပေါင်း အတော်အတန်ကြာမြင့်နေပြီဖြစ်ကြောင်း

关于如何解决这个问题的任何想法?

0 个答案:

没有答案