我尝试从包含json行的表中加载一些数据 有一个字段可以包含特殊字符\ t和\ r \ n,我想将它们保留在新表中。
这是我的档案:
{"text_sample": "this is a\tsimple test", "number_sample": 4}
以下是我的工作:
Drop table if exists temp_json;
Drop table if exists test;
create temporary table temp_json (values text);
copy temp_json from '/path/to/file';
create table test as (select
(values->>'text_sample') as text_sample,
(values->>'number_sample') as number_sample
from (
select replace(values,'\','\\')::json as values
from temp_json
) a);
我一直收到这个错误:
ERROR: invalid input syntax for type json
DETAIL: Character with value 0x09 must be escaped.
CONTEXT: JSON data, line 1: ...g] Objection to PDDRP Mediation (was Re: Call for...
我如何逃脱这些角色?
非常感谢
答案 0 :(得分:1)
将文件复制为csv
,使用不同的引号和分隔符:
drop table if exists test;
create table test (values jsonb);
\copy test from '/path/to/file.csv' with (format csv, quote '|', delimiter ';');
select values ->> 'text_sample', values ->> 'number_sample'
from test;
?column? | ?column?
-----------------------------+----------
this is a simple test | 4
答案 1 :(得分:1)
如Andrew Dunstan's PostgreSQL and Technical blog
中所述在文本模式下,由于JSON中存在反斜杠,因此COPY将被简单击败。因此,例如,任何包含嵌入式双引号或嵌入式换行符的字段,或根据JSON规范需要转义的其他任何字段,都会导致失败。在文本模式下,您几乎无法控制其工作方式-例如,您不能指定其他ESCAPE字符。所以文本模式根本行不通。
所以我们必须转到CSV
格式模式。
copy the_table(jsonfield)
from '/path/to/jsondata'
csv quote e'\x01' delimiter e'\x02';
在官方文档sql-copy中,一些参数在此处列出:
COPY table_name [ ( column_name [, ...] ) ]
FROM { 'filename' | PROGRAM 'command' | STDIN }
[ [ WITH ] ( option [, ...] ) ]
[ WHERE condition ]
where option can be one of:
FORMAT format_name
FREEZE [ boolean ]
DELIMITER 'delimiter_character'
NULL 'null_string'
HEADER [ boolean ]
QUOTE 'quote_character'
ESCAPE 'escape_character'
FORCE_QUOTE { ( column_name [, ...] ) | * }
FORCE_NOT_NULL ( column_name [, ...] )
FORCE_NULL ( column_name [, ...] )
ENCODING 'encoding_name'
答案 2 :(得分:0)
将json转换为文本,而不是从json获取文本值。例如:
t=# with j as (
select '{"text_sample": "this is a\tsimple test", "number_sample": 4}'::json v
)
select v->>'text_sample' your, (v->'text_sample')::text better
from j;
your | better
-----------------------------+--------------------------
this is a simple test | "this is a\tsimple test"
(1 row)
并避免0x09错误,请尝试使用
replace(values,chr(9),'\t')
在您的示例中替换反斜杠+ t,而不是实际的chr(9)
...