我有一些缅甸语文本,它被拆分为单个字符,以检查和删除相关Unicode块之外的字符,例如从缅甸语中删除拉丁字符。结果(如果我使用正确的术语)是字形集群已经分开如下:
ေမာင္ေကာင္းၫိႈ႕မွဴးႏိုင္
我相信虚线圆圈的位置应该是两个字符作为一个Unicode字符而不是两个。
正确渲染缅甸语不应该像这样的虚线圆圈:
ယနေ့ မြန်မာမှုအဖြစ် ပုံဖော်ပေးခဲ့သည့် ယဉ်ကျေးမှုမှာ နှစ်ပေါင်း အတော်အတန်ကြာမြင့်နေပြီဖြစ်ကြောင်း
关于如何解决这个问题的任何想法?