Question

我正在尝试创建一个窗口函数，该函数告诉我一个表是否包含：集群中的值A，B或A＆B

例如：

我创建了一个带有s3存储桶的JSON分区，如下所示：s3：// bucket_name / application_one / 2016/07/01/11 /

您的示例的表内容来自：

从Test_cluster限制2中选择*；

Row  V    T
1
{ "city": { "coord": { "lat": 2.2673, "lon": 102.5453 }, "country": "MY", "id": 1732857, "name": "Tangkak" }, "data": [ { "clouds": 100, "deg": 82, "dt": 1571544000, "humidity": 50, ...
2019-10-19 23:35:37.000

2
{ "city": { "coord": { "lat": 2.0251, "lon": 103.3328 }, "country": "MY", "id": 1732811, "name": "Kluang" }, "data": [ { "clouds": 100, "deg": 155, "dt": 1571544000, "humidity": 69, ...
2019-10-19 23:35:37.000

我尝试过的：

ALTER  TABLE Test_Cluster CLUSTER BY (V, T);
ALTER  TABLE Test_Cluster RECLUSTER;

我收到不支持变量类型的错误，是否可以使用其他格式或类型转换来重新定义变量Json表？

Answer 1

不支持在变体上进行聚类，但是可以在变体表达式上进行聚类。

请参见雪花文档中的以下示例：

-- cluster by paths in variant columns
create or replace table t3 (t timestamp, v variant) cluster by (v:"Data":id::number);

我可以正确地重新整理这张桌子吗？变体类型

1 个答案: