我有一个遗留的Postgres 8.4数据库,正在从中提取外部地址。数据库上的编码为UTF-8,大多数特殊字符看起来像普通可读字符一样好,例如:Á, É, Í, Ó, Ü
但是,有成千上万条使用其他编码对这些字符进行编码的记录,它们都以不可打印的STX
字符开头,然后是序列:6#x
,后跟1或2个十六进制字符。
例如:CUAUHT6#xc9;MOC
,应为:CUAUHTÉMOC
我尝试使用在线“解码器”来识别这种乱码,但是没有任何运气。但是,我能够根据城市名称并参考邮政编码来识别以下内容:
existing should be
-------- ---------
6#xc1; Á
6#xc9; É
6#xcd; Í
6#xd3; Ó
6#xdc; Ü
6#xd; " " (space)
数据看起来像这样存储在数据库中。尽管诚然,我是Postgres的新手,所以可能会丢失一些显而易见的东西。
查找和替换所有实例的时间很短,这是否是具有标准decode
功能的可识别编码?