让我解释一下。我有一个json数据集,其值如下:
"clientRequest": {
"uri": "/flow.php?id=FS-6097&utm_source=facebook&utm_medium=cpc&utm_term=cold",
"body": null,
"bytes": 608,
"flags": 1,
"referer": "http://m.facebook.com/",
"httpMethod": "GET",
"httpProtocol": "HTTP/1.1"
},
现在我想创建一个仅从“clientRequest.uri”获取值“FS-6097”的虚拟列。所以一个新的列只包含“FS-6097”,而不仅仅是整个uri。
我已经为下面的整个uri创建了一个虚拟列,这很好。
ALTER TABLE `table_xyz_json`
ADD `url` TEXT
GENERATED ALWAYS AS (JSON_UNQUOTE(
JSON_EXTRACT(json_data, '$.clientRequest.uri')
))
VIRTUAL NULL;
任何帮助都将受到高度赞赏。
答案 0 :(得分:1)
一种选择是使用SUBSTRING_INDEX功能:
ALTER TABLE `table_xyz_json`
ADD `url` TEXT GENERATED ALWAYS
AS (`json_data` ->> '$.clientRequest.uri') VIRTUAL NULL,
ADD `id` VARCHAR(7) GENERATED ALWAYS
AS (SUBSTRING_INDEX(
SUBSTRING_INDEX(`url`,
'id=', -1),
'&', 1)
) VIRTUAL NULL;
请参阅db-fiddle。
<强>更新强>
您应该根据适用的所有业务规则调整生成的列的表达式。例如,如果规则是id
可能不存在,您可以尝试类似:
ALTER TABLE `table_xyz_json`
ADD `url` TEXT GENERATED ALWAYS
AS (`json_data` ->> '$.clientRequest.uri') VIRTUAL NULL,
ADD `id` VARCHAR(7) GENERATED ALWAYS
AS (IF(`url` REGEXP 'id=',
SUBSTRING_INDEX(
SUBSTRING_INDEX(`url`,
'id=', -1),
'&', 1),
NULL
)
) VIRTUAL NULL;
请参阅db-fiddle。