我读了http://www.russellspitzer.com/2017/05/19/Spark-Sql-Thriftserver/这篇文章后感到困惑。它指出:
Spark上下文也无法在每个之间共享缓存的资源 其他。这意味着除非您具有单个Spark上下文,否则它是 多个用户无法共享缓存的数据。火花节俭 服务器可以是“单一上下文”,提供全球可用 缓存。
Spark context for the thrift server上的SO状态:
旧服务器中的Spark上下文只是其中之一。 Spark Thrift服务器是 不适合高并发应用程序访问。
Tableau等人正在将SIMBA连接用于Spark SQL,但是鉴于上述矛盾的说法,要得出什么结论?
此外,触发完全不同的SQL语句的用户将无法从缓存中受益,因为他们拥有所有自己的SQL。我认为如果从基表上的beeline进行预缓存,则缓存可以工作。还是不正确?