大多数阿拉伯字母都有多种上下文形式,例如后者ب
具有一般的unicode 0628
。
但如果后者出现在单词的开头,则会采用此格式بـ
unicode FE91
。
中= ـبـ
unicode FE92
。
单词的结尾= ـب
unicode FE90
。
我正在尝试获取char代码,但我总是得到一般的unicode。
procedure TfMain.btn2Click(Sender: TObject);
const
Str = 'يبداء';
Ch = 'ب';
begin
ShowMessage(IntToHex(Ord(Ch), 4)); // return 0628 - Correct
ShowMessage(IntToHex(Ord(Str[2]), 4)); // return 0628 - Wrong
end;
问:我如何获得char的正确代码,具体取决于它在单词中的位置?
更多信息
https://en.wikipedia.org/wiki/Bet_(letter)#Arabic_b.C4.81.CA.BE https://en.wikipedia.org/wiki/Arabic_script_in_Unicode