为什么Delphi IBX TWideMemoField转换UTF8字符串中的字节顺序,如何避免呢?

时间:2018-09-03 06:39:20

标签: delphi unicode utf-8 firebird firebird-3.0

我在Firebird 3数据库上将Delphi 2009和IBX一起使用(我没有选择其他技术的选择,我必须适应这种情况)。我有以下定义:

Firebird BLOB字段定义为:

BLOB SUB_TYPE 0 SEGMENT SIZE 80

TWideMemoField定义为:

object MainQryNOTES: TWideMemoField
  FieldName = 'NOTES'
  Origin = 'INVOICES.NOTES'
  ProviderFlags = [pfInUpdate]
  BlobType = ftWideMemo
end

测试字符串为“Цельпоинфляции,%”,并且可以从IBExpert软件的BLOB字段中读取,如下所示:

26 04 35 04 3B 04 4C 04 20 00 3F 04 3E 04 20 00
38 04 3D 04 44 04 3B 04 4F 04 46 04 38 04 38 04
2C 00 20 00 25 00

奇怪的是,Delphi会反转字节顺序,例如西里尔字母Ц的十六进制UTF8表示为04 26,但它存储在数据库中的格式为26 04,其他字符也是如此(人们可以借助表https://www.w3schools.com/charsets/ref_utf_basic_latin.asp和{{ 3}})。就我而言,我只有2个字节的字符,但是我想类似的情况也将是3个字节和4个字节的UTF8字符。

那么-如何配置TWideMemoField要求不转换UTF8字符串的字节顺序?

1 个答案:

答案 0 :(得分:3)

您的文本未编码为UTF8,而是被编码为UTF16。字符Ц是U+0426。按照惯例,16位代码单元以小尾数字节顺序存储,即$ 26 $ 04。

换句话说,一切都按照预期和设计进行,我认为您无需尝试修复任何问题,因为没有任何问题。