标签: hive hdfs
我了解默认情况下,hive会流式传输查询中最右边的表,可以通过使用/ * + STREAMTABLE(表名)* /来覆盖,该表将流化数据而不是将其保留在内存中。理想情况下,对较大的表进行流处理,以避免在内存处理中出现缓冲。
我的问题是流表提示如何在内部工作,即如何避免将数据加载到内存中并执行更快的操作?