postgresql json to columns error必须转义带有值的字符

时间:2017-05-08 19:34:10

标签: json postgresql insert special-characters

我尝试从包含json行的表中加载一些数据 有一个字段可以包含特殊字符\ t和\ r \ n,我想将它们保留在新表中。

这是我的档案:

{"text_sample": "this is a\tsimple test", "number_sample": 4}

以下是我的工作:

Drop table if exists temp_json;
Drop table if exists test;
create temporary table temp_json (values text);

copy temp_json from '/path/to/file';

create table test as (select 
        (values->>'text_sample') as text_sample,
        (values->>'number_sample') as number_sample
        from   (
           select replace(values,'\','\\')::json as values
           from   temp_json
       ) a);

我一直收到这个错误:

ERROR:  invalid input syntax for type json
DETAIL:  Character with value 0x09 must be escaped.
CONTEXT:  JSON data, line 1: ...g] Objection to PDDRP Mediation (was Re: Call for...

我如何逃脱这些角色?
非常感谢

3 个答案:

答案 0 :(得分:1)

将文件复制为csv,使用不同的引号和分隔符:

drop table if exists test;
create table test (values jsonb);
\copy test from '/path/to/file.csv' with (format csv, quote '|', delimiter ';');

select values ->> 'text_sample', values ->> 'number_sample'
from test;
          ?column?           | ?column? 
-----------------------------+----------
 this is a       simple test | 4

答案 1 :(得分:1)

Andrew Dunstan's PostgreSQL and Technical blog

中所述

在文本模式下,由于JSON中存在反斜杠,因此COPY将被简单击败。因此,例如,任何包含嵌入式双引号或嵌入式换行符的字段,或根据JSON规范需要转义的其他任何字段,都会导致失败。在文本模式下,您几乎无法控制其工作方式-例如,您不能指定其他ESCAPE字符。所以文本模式根本行不通。

所以我们必须转到CSV格式模式。

copy the_table(jsonfield) 
from '/path/to/jsondata' 
csv quote e'\x01' delimiter e'\x02';

在官方文档sql-copy中,一些参数在此处列出:

COPY table_name [ ( column_name [, ...] ) ]
    FROM { 'filename' | PROGRAM 'command' | STDIN }
    [ [ WITH ] ( option [, ...] ) ]
    [ WHERE condition ]

where option can be one of:

    FORMAT format_name
    FREEZE [ boolean ]
    DELIMITER 'delimiter_character'
    NULL 'null_string'
    HEADER [ boolean ]
    QUOTE 'quote_character'
    ESCAPE 'escape_character'
    FORCE_QUOTE { ( column_name [, ...] ) | * }
    FORCE_NOT_NULL ( column_name [, ...] )
    FORCE_NULL ( column_name [, ...] )
    ENCODING 'encoding_name'
  • FORMAT
    • 选择要读取或写入的数据格式:文本,csv(逗号分隔值)或二进制。默认值为文本。
  • QUOTE
    • 指定引用数据值时要使用的引用字符。默认值为双引号。这必须是一个单字节字符。仅当使用CSV格式时,才允许使用此选项。
  • DELIMITER
    • 指定在文件的每一行(行)中分隔列的字符。默认为文本格式的制表符,CSV格式的逗号。这必须是一个单字节字符。使用二进制格式时,不允许使用此选项。
  • NULL
    • 指定表示空值的字符串。默认值为文本格式\ N(反斜杠-N),以及CSV格式的无引号的空字符串。对于不想将空值与空字符串区分开的情况,甚至可能以文本格式使用空字符串。使用二进制格式时,不允许使用此选项。
  • 标题
    • 指定文件包含标题行,其中包含文件中每一列的名称。输出时,第一行包含表中的列名,输入时,第一行被忽略。仅当使用CSV格式时,才允许使用此选项。

答案 2 :(得分:0)

将json转换为文本,而不是从json获取文本值。例如:

t=# with j as (
        select '{"text_sample": "this is a\tsimple test", "number_sample": 4}'::json v
)
select v->>'text_sample' your, (v->'text_sample')::text better
from j;
            your             |          better
-----------------------------+--------------------------
 this is a       simple test | "this is a\tsimple test"
(1 row)

并避免0x09错误,请尝试使用

replace(values,chr(9),'\t')

在您的示例中替换反斜杠+ t,而不是实际的chr(9) ...