Question

我有一个遗留的Postgres 8.4数据库，正在从中提取外部地址。数据库上的编码为UTF-8，大多数特殊字符看起来像普通可读字符一样好，例如：Á, É, Í, Ó, Ü

但是，有成千上万条使用其他编码对这些字符进行编码的记录，它们都以不可打印的STX字符开头，然后是序列：6#x，后跟1或2个十六进制字符。

例如：CUAUHT6#xc9;MOC，应为：CUAUHTÉMOC

我尝试使用在线“解码器”来识别这种乱码，但是没有任何运气。但是，我能够根据城市名称并参考邮政编码来识别以下内容：

existing          should be
--------          ---------
6#xc1;            Á
6#xc9;            É
6#xcd;            Í
6#xd3;            Ó
6#xdc;            Ü
6#xd;             " " (space)

数据看起来像这样存储在数据库中。尽管诚然，我是Postgres的新手，所以可能会丢失一些显而易见的东西。

查找和替换所有实例的时间很短，这是否是具有标准decode功能的可识别编码？

postgres数据库中的这种编码是什么，如何解码

0 个答案: