我使用Spark 1.6.2(来自Datastax Enterprise Edition => DSE 5.0.4)和Python 2.7
当我提供
from impala.dbapi import connect
Conn = connect (host = '172.31.12.201', port = 7077, user = 'xxxx', password = 'xxxx1111', database = 'test_database', auth_mechanism = 'PLAIN')
它只是悬挂而且永远不会出现因为火花主机在端口7077上运行在172.31.12.201上
我在超集中的配置如下
SQLAlchemy URI => impala://172.31.12.201:7077/test_database
Extra => {
"metadata_params": {},
"engine_params": {"connect_args": {"user": "xxxx", "password": "xxxx1111"}} }
答案 0 :(得分:2)
我必须启动dse spark thrift服务器,如下所示
dse -u <username> -p <password> spark-sql-thriftserver start
这将在端口10000上的DSE集群中启动配置单元服务器