如何在大查询中将正则表达式与JSON_EXTRACT一起使用

时间:2019-03-13 12:16:03

标签: sql regex google-bigquery

我在大查询表上有一个JSON字段,目前我正在使用以下方法从id元素中提取(例如):

coalesce(
   nullif(JSON_EXTRACT(e.event_payload, 'content_id'), ''),
   nullif(JSON_EXTRACT(e.event_payload, 'cid'), ''),
   nullif(JSON_EXTRACT(e.event_payload, 'c_id'), ''),
   ...
  ) AS content_id,

我在此JSON字段上没有模式...可以在像这样的大查询上将REGEX与JSON_EXTRACT一起使用吗?

JSON_EXTRACT(e.event_payload, "(content_id|cid|c_id)") as content_id

1 个答案:

答案 0 :(得分:3)

您可以替换可能的字段名称,然后执行提取:

SELECT
  JSON_EXTRACT(
    REGEXP_REPLACE(e.event_payload, r'"c\_?id"', '"content_id"'),
    '$.content_id') as content_id
FROM dataset.table

作为一个独立的示例:

WITH T AS (
  SELECT '{"cid": {"a": 1}}' AS event_payload UNION ALL
  SELECT '{"content_id": {"b": 2}}' UNION ALL
  SELECT '{"c_id": {"c": 3}}'
)
SELECT
  JSON_EXTRACT(
    REGEXP_REPLACE(e.event_payload, r'"c\_?id"', '"content_id"'),
    '$.content_id') as content_id
FROM T AS e