无法在EMR Spark群集上使用Tableau

时间:2018-07-23 17:54:26

标签: apache-spark odbc tableau

我有一个客户想要在其EMR Spark群集上使用Tableau。

文档看似简单明了,但尝试连接时出现错误。

这是设置:

  1. EMR群集的主服务器没有公共IP,但是从Tableau桌面EC2实例中,我可以ping和telnet到运行thrift的端口10001
  2. 我能够用thrift测试beeline,并且连接正常
  3. 鉴于群集具有限制的访问权限,我不使用SSL或身份验证
  4. 我已经安装了数据直接8.0和simbaodbc

我正在使用emr-5.13.0,Hadoop发行版是Amazon 2.8.3,Spark版本是2.3.0。

错误是

Unable to connect to the ODBC Data Source. Check that the necessary drivers are installed and that the connection properties are valid.

[Simba][ThriftExtension] (5) Error occurred while contacting server: No more data to read.. This could be because you are trying to establish a non-SSL connection to an SSL-enabled server.

Unable to connect to the server "IP". Check that the server is running and that you have access privileges to the requested database."

我只是遵循Tableau提供的文档,该文档说只安装驱动程序(不要与ODBC混淆),然后在Tableau中使用它。我已经验证在尝试连接之前没有设置SSL和身份验证。我还通过运行Datagrip并从Tableau EC2实例进行查询来进行验证,该实例工作正常。

1 个答案:

答案 0 :(得分:0)

通过忽略文档并仅设置odbc驱动程序,然后选择它而不是sparksql作为源来解决了该问题。