Thinbug
News
如何将HDFS 2表(其中1较小的表)联接到集群中节点的RAM中?
时间:2019-05-23 11:20:58
标签:
hive
hdfs
hiveql
我在HDFS / Hive中有以下表格:
一张桌子,例如D,它很小,足以存储在集群中单个计算节点的RAM中
另一张桌子,例如E,比D大得多(E超出了群集节点的平均RAM)
基于上述情况,由于我是HDFS的新手,因此我有以下问题:
在HDFS / Hive中拥有上面的表格实际上有什么影响?
假设查询返回D.value和E.value,如何在Hive中编写高效的查询来优化D和E之间的连接(D.key = E.key上的INNER JOIN)?
谢谢。
0 个答案:
没有答案
相关问题
哪种组合小型HDFS块最简单?
如何加入2个表来获得1个表?
如何在Hadoop HDFS中检查多节点集群中/ user / hadoop分区的磁盘使用情况
如何从远程计算机在群集中的数据节点上运行数据节点块扫描程序
四节点群集上的Hadoop复制因子为1
如何删除不同群集中的HDFS中的文件?
在群集体系结构中扩展RAM?
群集重启后,来自Cloudera群集(主要位于hive表中)的数据丢失
名称节点如何确定数据节点中存储的不同数据块何时停止?
如何将HDFS 2表(其中1较小的表)联接到集群中节点的RAM中?
最新问题
我写了这段代码,但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值,但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场?
是否有可能使 loadstring 不可能等于打印?卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用?
在此代码中是否有使用“this”的替代方法?
在 SQL Server 和 PostgreSQL 上查询,我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源?