获取错误无效的字节序列进行编码

时间:2014-01-02 10:54:00

标签: postgresql

我有表raw_ca_dd

将数据上传到表格时,我收到如下错误:

invalid byte sequence for encoding "UTF8": 0xfb
\copy raw_ca_dd from 'dbo_CA_list.csv.dak' with delimiter ','  csv quote as '"'

我无法找到此错误。帮助

1 个答案:

答案 0 :(得分:3)

我说你的文件采用不同的编码,例如iso-8859-15,而不是utf-8,因为0xfb无效utf-8,但是û许多ISO 8859编码。它也可能是ϋűћū在各种其他ISO 8859编码中。还有一堆代码页(例如cp1255),我没有费心去检查。

找出文件的正确编码,并使用encoding命令的copy参数指定它,例如:

\copy raw_ca_dd from 'dbo_CA_list.csv.dak' with encoding 'iso-8859-1' delimiter ','  csv quote as '"' 

不要认为它是iso-8850-15。找出输入文件的实际文本编码并使用它。