如何在pyspark df上创建索引?

时间:2018-02-26 08:42:08

标签: apache-spark hive pyspark spark-dataframe

我有一堆蜂巢表。
我想:

  1. 将桌子拉入pyspark DF。
  2. 对它们执行UDF。
  3. 根据客户ID加入4个表。
  4. 是否存在火花索引以加速操作的概念?

    • 如果是这样的命令?
    • 如何在数据框架上创建索引?

0 个答案:

没有答案