根据此页面:https://spark.apache.org/sql/您可以通过ODBC或JDBC将现有BI工具连接到Spark SQL:
我不是指Shark,因为这基本上是EOL:
正是出于这个原因,我们将Shark中的开发作为一个单独的项目结束,并将所有开发资源转移到Spark SQL中的新组件Spark。
BI工具(如Tableau)如何通过ODBC连接到shark sql?
答案 0 :(得分:4)
随着Spark SQL 1.1的发布,您还有thrift JDBC驱动程序,请参阅https://spark.apache.org/docs/latest/sql-programming-guide.html#distributed-sql-engine
答案 1 :(得分:3)
Simba提供了Databricks使用的ODBC驱动程序,但这仅适用于Databricks发行版。我们将于明天(星期三,12月3日)在www.simba.com推出用于Apache的公共版本。您可以下载并试用该驱动程序,以便与Tableau一起使用。
答案 2 :(得分:1)
请查看:http://www.openstratio.org/blog/connecting-to-the-stratio-big-data-platform-using-odbc-2/
Stratio是一个平台,包含经过认证的Spark发行版,允许您将Spark连接到任何类型的数据存储库(如Cassandra,MongoDB,...)。它有一个ODBC驱动程序,因此您可以编写SQL查询,将其转换为Spark作业,甚至更快,直接查询到Cassandra - 或者您希望连接到哪个数据库 - 如果可能的话。这样,将Tableau连接到Spark和数据存储库非常简单。如果您需要任何帮助,我们将非常乐意为您提供帮助。
免责声明:我是Stratio的ODBC开发人员之一
答案 3 :(得分:1)
正如卡洛斯所说,Stratio Meta是一个模块,它充当不同持久层的解析器,验证器,规划器和协调器层(目前只有Cassandra和Mongo,短期内也是HDFS)。这个模块为Shell提供了类似SQL的语言,Java / Scala API,REST API和ODBC(简称JDBC)。它还使用另一个Stratio模块Stratio Deep,它允许我们使用Apache Spark以高效快捷的方式执行查询。
免责声明:我目前受雇于Stratio Big Data
答案 4 :(得分:1)
Simba将提供一个:http://databricks.com/blog/2014/04/30/Databricks-selects-Simba-ODBC-driver-for-shark.html。没有已知的正式发布日期。
[更新]
答案 5 :(得分:0)
对于Azure HDInsight上的Spark,您可以按照https://azure.microsoft.com/en-us/documentation/articles/hdinsight-apache-spark-use-bi-tools/所述连接Tableau(或PowerBI)。 ODBC驱动程序位于:http://www.microsoft.com/en-us/download/details.aspx?id=47713