Question

我设置了spark-cassandra群集。 cqlsh工作正常。我启动了thriftserver并使用beeline命令行连接到它。我能做到

use schemaname
show schemas
show tables

但很简单

select * from tablename

卡住了。

我尝试了一个通过jdbc：hive2接口的java客户端，它显示了相同的行为。在展示桌上取得好成绩，但没有回报简单的选择语句。

火花控制台显示所有没有投诉迹象的作业。这项工作停留在Compiled阶段。

任何人都知道如何更深入地诊断？

Answer 1

在sql中为cassandra表创建临时表。喜欢以下方式

scala> sqlContext.sql(
   """CREATE TEMPORARY TABLE words
     |USING org.apache.spark.sql.cassandra
     |OPTIONS (
     |  table "words",
     |  keyspace "test",
     |  cluster "Test Cluster",
     |  pushdown "true"
     |)""".stripMargin)
scala> val df = sqlContext.sql("SELECT * FROM words")
scala> df.show()

Answer 2

我对编码很好。这个问题解决了。这是因为这个设置没有通过纱线，并且thriftserver的第一个实例占用了集群中的所有核心。我在第二个thriftserver实例上发出了sql，它有0个内核可供使用。

sql查询到spark-cassandra集群thriftserver不返回

2 个答案: