解析凤凰数组数据

时间:2021-01-11 13:53:47

标签: arrays phoenix

元素 X1 的凤凰数据样本:
['[A, B, C, D, E]', '[A1, B1,C1, D1, E1]','[A2, B2, C2, D2, E2]','[A3, B3, C3 , D3, E3]']

数据元素 X1 有可变数量的 [a, b, c, d, e] 块。

我想将数据元素 X1 的数组子项 A、C、E 解析为单独的列,然后将下一组 a1、C1、E2 解析为下一行,并循环遍历未知 (x) 数 A, C、E 组。
最终输出示例

<头>
col1 Col2 Col3
A C E
A1 C1 E1
A2 C2 E2
斧头 Cx Ex

我能够使用以下方法解析记录组的各个部分:

REGEXP_REPLACE(REGEXP_SPLIT([1],',')[1],']',") as X1a_Parsed (item 第一个数组组的第一项)

我也尝试过爆炸,看起来 apache Phoenix 还不支持“爆炸”。 问题:

  1. 是否可以在 REGEXP_REPLACE 中使用通配符“*”?
  2. 是否可以在 REGEXP_REPLACE 中使用通配符“*”?
    或者一种计算记录数组组的方法来设置一段时间/执行循环计数器来获取每个记录组,然后解析每个数组记录组中的第一、第三和第五项?
  3. 从 phoenix 表中获取所需的数据,然后使用 PANDA 或其他方法进行解析?

谢谢

0 个答案:

没有答案