标签: hadoop hive schema
要求是跟上目标ORC表的模式演变。我从源代码接收JSON事件。我们计划将这些转换为AVRO(因为它支持模式演变)。由于模式可以每天/每周更改,我们需要继续摄取新数据JSON文件,将它们转换为AVRO并将所有数据(旧/新)存储在ORC配置单元表中。我们如何解决这个问题?
答案 0 :(得分:0)
您可以遵循以下方法,这是您可以实现的许多不同方法之一。
<强> 1。创建HBASE表
<强> 2。创建Hive Wrapper表
第3。创建ORC表
<强> 4。你需要处理的事情