Hive中同一个表的几种集合格式

时间:2012-03-08 12:12:50

标签: hive

我处理每个记录有两个地图的数据,一个是(“&”,“=”) - 格式化(id = 111& name = ...),另一个是(“;”,“=” )格式。

当然,我可以:

  • 替换“;”通过“&”在数据中
  • 或定义
    • 其中一个作为MAP,在声明中指定了“收集项目终止...”
    • 并将其他地图视为STRING,并在每次查询时使用str_to_map()对其进行解析。

但是,对于同一张桌子,是不是还有更优雅的解决方案,例如多种收集格式声明

感谢。

1 个答案:

答案 0 :(得分:0)

如何编写自己的Writable和SerDe来创建一个包含4列的表:

  • String key1
  • String value1
  • String key2
  • String value2

您可以使用此example作为起点。