PYSPARK在重复的列名中设置默认值

时间:2017-11-26 08:52:30

标签: python apache-spark dataframe pyspark

在pyspark中,我有一个包含10列的数据框:

id, last_name, first_name, manager, shop, location, manager, place, country, status

我想将默认值设置为仅第一个列管理器,我尝试过:

df.withColumn("manager", "x1")

但它给出了一个模糊引用的错误,因为有两列具有相同的名称。

有没有办法在不重命名列的情况下执行此操作?

0 个答案:

没有答案