时间:2019-06-27 22:39:45

标签: apache-spark hbase amazon-emr phoenix

我在Spark中使用以下代码将HBase / Phoenix表的指定列加载到Spark Dataframe中。我可以指定要加载的列,但可以指定哪些行?还是我必须加载所有行?

import org.apache.hadoop.conf.Configuration
import org.apache.spark.SparkContext
import org.apache.spark.sql.SQLContext
import org.apache.phoenix.spark._

sc.stop()

val sc = new SparkContext("local", "phoenix-test")
val df = sqlContext.phoenixTableAsDataFrame(
     "TABLENAME", Array("ROWKEY", "CF.COL1","CF.COL2","CF.COL3"), conf = configuration
     )

0 个答案:

没有答案