应用错误收集

PYSPARK在重复的列名中设置默认值

时间：2017-11-26 08:52:30

标签： python apache-spark dataframe pyspark

在pyspark中，我有一个包含10列的数据框：

id, last_name, first_name, manager, shop, location, manager, place, country, status

我想将默认值设置为仅第一个列管理器，我尝试过：

df.withColumn("manager", "x1")

但它给出了一个模糊引用的错误，因为有两列具有相同的名称。

有没有办法在不重命名列的情况下执行此操作？

0 个答案:

没有答案