postgres数据库中的这种编码是什么,如何解码

时间:2019-05-18 05:17:54

标签: postgresql utf-8 character-encoding

我有一个遗留的Postgres 8.4数据库,正在从中提取外部地址。数据库上的编码为UTF-8,大多数特殊字符看起来像普通可读字符一样好,例如:Á, É, Í, Ó, Ü

但是,有成千上万条使用其他编码对这些字符进行编码的记录,它们都以不可打印的STX字符开头,然后是序列:6#x,后跟1或2个十六进制字符。

例如:CUAUHT6#xc9;MOC,应为:CUAUHTÉMOC

我尝试使用在线“解码器”来识别这种乱码,但是没有任何运气。但是,我能够根据城市名称并参考邮政编码来识别以下内容:

existing          should be
--------          ---------
6#xc1;            Á
6#xc9;            É
6#xcd;            Í
6#xd3;            Ó
6#xdc;            Ü
6#xd;             " " (space)

数据看起来像这样存储在数据库中。尽管诚然,我是Postgres的新手,所以可能会丢失一些显而易见的东西。

查找和替换所有实例的时间很短,这是否是具有标准decode功能的可识别编码?

0 个答案:

没有答案