我在大查询表上有一个JSON字段,目前我正在使用以下方法从id元素中提取(例如):
coalesce(
nullif(JSON_EXTRACT(e.event_payload, 'content_id'), ''),
nullif(JSON_EXTRACT(e.event_payload, 'cid'), ''),
nullif(JSON_EXTRACT(e.event_payload, 'c_id'), ''),
...
) AS content_id,
我在此JSON字段上没有模式...可以在像这样的大查询上将REGEX与JSON_EXTRACT一起使用吗?
JSON_EXTRACT(e.event_payload, "(content_id|cid|c_id)") as content_id
答案 0 :(得分:3)
您可以替换可能的字段名称,然后执行提取:
SELECT
JSON_EXTRACT(
REGEXP_REPLACE(e.event_payload, r'"c\_?id"', '"content_id"'),
'$.content_id') as content_id
FROM dataset.table
作为一个独立的示例:
WITH T AS (
SELECT '{"cid": {"a": 1}}' AS event_payload UNION ALL
SELECT '{"content_id": {"b": 2}}' UNION ALL
SELECT '{"c_id": {"c": 3}}'
)
SELECT
JSON_EXTRACT(
REGEXP_REPLACE(e.event_payload, r'"c\_?id"', '"content_id"'),
'$.content_id') as content_id
FROM T AS e