通过ODBC连接到Spark SQL

时间:2014-09-08 18:05:45

标签: hadoop odbc apache-spark shark-sql

根据此页面:https://spark.apache.org/sql/您可以通过ODBC或JDBC将现有BI工具连接到Spark SQL: screen shot for spark sql

我不是指Shark,因为这基本上是EOL

  

正是出于这个原因,我们将Shark中的开发作为一个单独的项目结束,并将所有开发资源转移到Spark SQL中的新组件Spark。

BI工具(如Tableau)如何通过ODBC连接到shark sql?

6 个答案:

答案 0 :(得分:4)

随着Spark SQL 1.1的发布,您还有thrift JDBC驱动程序,请参阅https://spark.apache.org/docs/latest/sql-programming-guide.html#distributed-sql-engine

答案 1 :(得分:3)

Simba提供了Databricks使用的ODBC驱动程序,但这仅适用于Databricks发行版。我们将于明天(星期三,12月3日)在www.simba.com推出用于Apache的公共版本。您可以下载并试用该驱动程序,以便与Tableau一起使用。

答案 2 :(得分:1)

请查看:http://www.openstratio.org/blog/connecting-to-the-stratio-big-data-platform-using-odbc-2/

Stratio是一个平台,包含经过认证的Spark发行版,允许您将Spark连接到任何类型的数据存储库(如Cassandra,MongoDB,...)。它有一个ODBC驱动程序,因此您可以编写SQL查询,将其转换为Spark作业,甚至更快,直接查询到Cassandra - 或者您希望连接到哪个数据库 - 如果可能的话。这样,将Tableau连接到Spark和数据存储库非常简单。如果您需要任何帮助,我们将非常乐意为您提供帮助。

免责声明:我是Stratio的ODBC开发人员之一

答案 3 :(得分:1)

正如卡洛斯所说,Stratio Meta是一个模块,它充当不同持久层的解析器,验证器,规划器和协调器层(目前只有Cassandra和Mongo,短期内也是HDFS)。这个模块为Shell提供了类似SQL的语言,Java / Scala API,REST API和ODBC(简称JDBC)。它还使用另一个Stratio模块Stratio Deep,它允许我们使用Apache Spark以高效快捷的方式执行查询。

免责声明:我目前受雇于Stratio Big Data

答案 4 :(得分:1)

Simba将提供一个:http://databricks.com/blog/2014/04/30/Databricks-selects-Simba-ODBC-driver-for-shark.html。没有已知的正式发布日期。

[更新]

使用HIVE的ODBC驱动程序按照herehere所述连接到Spark SQL。

答案 5 :(得分:0)

对于Azure HDInsight上的Spark,您可以按照https://azure.microsoft.com/en-us/documentation/articles/hdinsight-apache-spark-use-bi-tools/所述连接Tableau(或PowerBI)。 ODBC驱动程序位于:http://www.microsoft.com/en-us/download/details.aspx?id=47713