将名称设置为RDD的优点

时间:2016-03-17 13:25:12

标签: scala apache-spark

有可用于为RDD分配名称的API。

例如

val y = sc.parallelize(List(1,2,3))
y.setName("New Name")

它有什么优势?此功能在Spark中可用的任何特定原因?

提前致谢。

2 个答案:

答案 0 :(得分:11)

当您对其进行缓存时,您可以在“存储”选项卡上的Spark Web UI中看到该名称。

答案 1 :(得分:1)

RDD的源代码中说明了这一点:

/** A friendly name for this RDD */
  @transient var name: String = null

  /** Assign a name to this RDD */
  def setName(_name: String): this.type = {
    name = _name
    this
  }

实际上,为了向用户提供帮助,以便为程序员选择的名称添加新控件到RDD。总是很高兴有一个字段来描述或命名一个对象,用于识别,安全,允许操作,记录......