我设置了spark-cassandra群集。 cqlsh工作正常。我启动了thriftserver并使用beeline命令行连接到它。我能做到
use schemaname
show schemas
show tables
但很简单
select * from tablename
卡住了。
我尝试了一个通过jdbc:hive2接口的java客户端,它显示了相同的行为。在展示桌上取得好成绩,但没有回报 简单的选择语句。
火花控制台显示所有没有投诉迹象的作业。这项工作停留在Compiled阶段。
任何人都知道如何更深入地诊断?
答案 0 :(得分:0)
在sql中为cassandra表创建临时表。喜欢以下方式
scala> sqlContext.sql(
"""CREATE TEMPORARY TABLE words
|USING org.apache.spark.sql.cassandra
|OPTIONS (
| table "words",
| keyspace "test",
| cluster "Test Cluster",
| pushdown "true"
|)""".stripMargin)
scala> val df = sqlContext.sql("SELECT * FROM words")
scala> df.show()
答案 1 :(得分:0)
我对编码很好。这个问题解决了。这是因为这个设置没有通过纱线,并且thriftserver的第一个实例占用了集群中的所有核心。我在第二个thriftserver实例上发出了sql,它有0个内核可供使用。