sql查询到spark-cassandra集群thriftserver不返回

时间:2016-05-02 23:43:04

标签: jdbc hive thrift spark-cassandra-connector beeline

我设置了spark-cassandra群集。 cqlsh工作正常。我启动了thriftserver并使用beeline命令行连接到它。我能做到

use schemaname
show schemas
show tables

但很简单

select * from tablename 

卡住了。

我尝试了一个通过jdbc:hive2接口的java客户端,它显示了相同的行为。在展示桌上取得好成绩,但没有回报     简单的选择语句。

火花控制台显示所有没有投诉迹象的作业。这项工作停留在Compiled阶段。

任何人都知道如何更深入地诊断?

2 个答案:

答案 0 :(得分:0)

在sql中为cassandra表创建临时表。喜欢以下方式

scala> sqlContext.sql(
   """CREATE TEMPORARY TABLE words
     |USING org.apache.spark.sql.cassandra
     |OPTIONS (
     |  table "words",
     |  keyspace "test",
     |  cluster "Test Cluster",
     |  pushdown "true"
     |)""".stripMargin)
scala> val df = sqlContext.sql("SELECT * FROM words")
scala> df.show()

答案 1 :(得分:0)

我对编码很好。这个问题解决了。这是因为这个设置没有通过纱线,并且thriftserver的第一个实例占用了集群中的所有核心。我在第二个thriftserver实例上发出了sql,它有0个内核可供使用。