标签: python apache-spark dataframe pyspark
在pyspark中,我有一个包含10列的数据框:
id, last_name, first_name, manager, shop, location, manager, place, country, status
我想将默认值设置为仅第一个列管理器,我尝试过:
df.withColumn("manager", "x1")
但它给出了一个模糊引用的错误,因为有两列具有相同的名称。
有没有办法在不重命名列的情况下执行此操作?