Unicode中的两种阿拉伯字体表示

时间:2018-08-01 06:50:13

标签: unicode arabic typography arabic-support

我正在处理带有阿拉伯文本的应用程序,我发现总是有两种方法可以用阿拉伯语编写相同的文本。我无法理解为什么会发生这种情况,以及如何将它们中的任何一个转换为另一个以开发一致的UI。

这是阿拉伯语短语的一个例子。

  

اللّهُمَّ صَلِّ عَلَى مُحَمَّدٍ وَآلِ مُحَمَّدٍ

     

اَﻟﻠّﻬُﻢﱠ ﺻَﻞﱢ َ وَ ﺁلِ ﻣُﺤَﻤﱠﺪٍ

我看到它在预览中看起来一样,但是有所不同,我想获得相同的结果。

这是我如何在Notes中区分这两者

screenshot of notes to show the difference

1 个答案:

答案 0 :(得分:0)

它们在我的浏览器中看起来有所不同,并且按照发布的顺序获得每个的Unicode代码点

U+627 U+644 U+644 U+651 U+647 U+64F U+645 U+651 U+64E U+20 U+635 U+64E U+644 U+651 U+650 U+20 U+639 U+64E U+644 U+64E U+649 U+20 U+645 U+64F U+62D U+64E U+645 U+651 U+64E U+62F U+64D U+20 U+648 U+64E U+622 U+644 U+650 U+20 U+645 U+64F U+62D U+64E U+645 U+651 U+64E U+62F U+64D

U+627 U+64E U+FEDF U+FEE0 U+651 U+FEEC U+64F U+FEE2 U+FC60 U+20 U+FEBB U+64E U+FEDE U+FC62 U+20 U+FECB U+64E U+FEE0 U+FEF0 U+20 U+FEE3 U+64F U+FEA4 U+64E U+FEE4 U+FC60 U+FEAA U+64D U+20 U+648 U+64E U+20 U+FE81 U+644 U+650 U+20 U+FEE3 U+64F U+FEA4 U+64E U+FEE4 U+FC60 U+FEAA U+64D

检查第一行中的前三个字母是ALEF,LAM,LAM,第二行是ALEF,FATHA,LAM INITIAL FORM

这很奇怪,因为初始形式不应出现在单词的中间。看来您的数据没有正确清除。除了检查每个字母外,我不知道解决此问题的方法。