我正在研究大数据应用程序,目前每天读取10 gbs数据并将其持久保存到echo $PATH
。另一个是每天1 GB(最近创建)。我们公司的架构限制我们拥有Hive
Hive Hivec on 2 clusters. Apparently, data on these 2
Zeppelin`。 (请参阅下面的架构)
拥有一个clusters (having 2 tables) needs to be joined for a really important use case using a single
有2个优点:
1)我们必须为一个Zeppelin
提供支持。
2)增加了便利性并增强了用例。
可以请您分享一种方法吗?
我已经浏览过Zeppelin
个文档和Hive
个文档。不确定如何在Zeppelin
或interpretor.json
文件中提供这些设置。我还没有真正在堆栈流上看到这样的问题。
我在想也许有办法做到这一点:
zeppelin-env