以下是短篇小说:
BI工具(PowerBI)连接到Spark集群,并使用HiveThriftServer2应用程序通过配置单元查询获取聚合数据。
但是,每次从文件读取数据时,每次查询都会花费很多时间。我想在这个应用程序中缓存我的表,并寻找通过相同的通道发送查询“缓存表myTable”的方法,以便下一个查询可以快速运行。
将hive查询发送到特定应用程序的解决方案是什么?如果重要,该应用程序是Spark的节俭服务。
非常感谢!
答案 0 :(得分:0)
看起来我成功了,通过安装Spark Odbc驱动程序并使用它连接到thift服务器并发送sql查询"缓存表xxx"。我想知道是否有更优雅的方式