据帧'对象没有属性' add_suffix'

时间:2018-02-21 04:14:38

标签: pyspark spark-dataframe

from pyspark.sql.functions import *
z= k.withColumn('date', when( k.date > 29, 1).otherwise(0)).collect()

我想为数据框添加后缀

z1 = k.add_suffix(19)

将错误视为

  

AttributeError:' DataFrame'对象没有属性' add_suffix'

由于

2 个答案:

答案 0 :(得分:0)

尝试使用 .withColumnRenamed 函数而不是add_suffix。

z1 = k.withColumnRenamed('date', 'date_19')

(或)

您可以创建一个lambda函数,该函数可以为数据框中的所有列名添加后缀。

参考: - How to add suffix and prefix to all columns in python/pyspark dataframe

答案 1 :(得分:0)

如果要将后缀添加到pyspark数据框中的多个列,则可以使用 for 循环和 .withColumnRenamed()

例如,您可能会喜欢:

def add_suffix(sdf, suffix):

      for c in sdf.columns:

            sdf = sdf.withColumnRenamed(c, '{}{}'.format(c, suffix))

      return sdf

您可以根据需要修改sdf.columns。