Hive-Streamtable提示与将数据保存在缓冲区之间的区别(in_memory)

时间:2018-10-15 23:52:10

标签: hive hdfs

我了解默认情况下,hive会流式传输查询中最右边的表,可以通过使用/ * + STREAMTABLE(表名)* /来覆盖,该表将流化数据而不是将其保留在内存中。理想情况下,对较大的表进行流处理,以避免在内存处理中出现缓冲。

我的问题是流表提示如何在内部工作,即如何避免将数据加载到内存中并执行更快的操作?

0 个答案:

没有答案