from pyspark.sql.functions import *
z= k.withColumn('date', when( k.date > 29, 1).otherwise(0)).collect()
我想为数据框添加后缀
z1 = k.add_suffix(19)
将错误视为
AttributeError:' DataFrame'对象没有属性' add_suffix'
由于
答案 0 :(得分:0)
尝试使用 .withColumnRenamed 函数而不是add_suffix。
z1 = k.withColumnRenamed('date', 'date_19')
(或)
您可以创建一个lambda函数,该函数可以为数据框中的所有列名添加后缀。
参考: - How to add suffix and prefix to all columns in python/pyspark dataframe
答案 1 :(得分:0)
如果要将后缀添加到pyspark数据框中的多个列,则可以使用 for 循环和 .withColumnRenamed()。
例如,您可能会喜欢:
def add_suffix(sdf, suffix):
for c in sdf.columns:
sdf = sdf.withColumnRenamed(c, '{}{}'.format(c, suffix))
return sdf
您可以根据需要修改sdf.columns。