我正在尝试创建一个窗口函数,该函数告诉我一个表是否包含: 集群中的值A,B或A&B
例如:
我创建了一个带有s3存储桶的JSON分区,如下所示:s3:// bucket_name / application_one / 2016/07/01/11 /
您的示例的表内容来自:
从Test_cluster限制2中选择*;
Row V T
1
{ "city": { "coord": { "lat": 2.2673, "lon": 102.5453 }, "country": "MY", "id": 1732857, "name": "Tangkak" }, "data": [ { "clouds": 100, "deg": 82, "dt": 1571544000, "humidity": 50, ...
2019-10-19 23:35:37.000
2
{ "city": { "coord": { "lat": 2.0251, "lon": 103.3328 }, "country": "MY", "id": 1732811, "name": "Kluang" }, "data": [ { "clouds": 100, "deg": 155, "dt": 1571544000, "humidity": 69, ...
2019-10-19 23:35:37.000
我尝试过的:
ALTER TABLE Test_Cluster CLUSTER BY (V, T);
ALTER TABLE Test_Cluster RECLUSTER;
我收到不支持变量类型的错误,是否可以使用其他格式或类型转换来重新定义变量Json表?
答案 0 :(得分:1)
不支持在变体上进行聚类,但是可以在变体表达式上进行聚类。
请参见雪花文档中的以下示例:
-- cluster by paths in variant columns
create or replace table t3 (t timestamp, v variant) cluster by (v:"Data":id::number);