SparkSQL的Airbnb Superset数据源配置

时间:2017-02-17 12:54:48

标签: apache-spark-sql datastax-enterprise datastax-startup superset

我使用Spark 1.6.2(来自Datastax Enterprise Edition => DSE 5.0.4)和Python 2.7
当我提供

from impala.dbapi import connect    
Conn = connect (host = '172.31.12.201', port = 7077, user = 'xxxx', password = 'xxxx1111', database = 'test_database', auth_mechanism = 'PLAIN') 

它只是悬挂而且永远不会出现因为火花主机在端口7077上运行在172.31.12.201上

我在超集中的配置如下

SQLAlchemy URI => impala://172.31.12.201:7077/test_database
Extra => {
"metadata_params": {},
"engine_params": {"connect_args": {"user": "xxxx", "password": "xxxx1111"}} }

1 个答案:

答案 0 :(得分:2)

我必须启动dse spark thrift服务器,如下所示

dse -u <username> -p <password> spark-sql-thriftserver start

这将在端口10000上的DSE集群中启动配置单元服务器