标签: dataframe pyspark
我想在我的pyspark数据框中添加索引列。 我正在使用此代码:
from pyspark.sql import functions as f cols = df.columns df = df.rdd.zipWithIndex().toDF(cols + ['index']).withColumn('index', f.col('index'))
它给出此错误: ValueError:无法将字符串转换为浮点数
即使我的列类型也是float
有什么帮助吗?