Pyspark:我如何选择除名称以外的所有列?

时间:2018-11-01 17:08:06

标签: apache-spark pyspark apache-spark-sql

我有一个Spark数据框,我想对除第一列(我想按名称或编号选择)之外的所有列执行array = np.array(df.collect())。我该怎么办?

2 个答案:

答案 0 :(得分:1)

我是这样做的:

obs

答案 1 :(得分:0)

您可以尝试

first_col = 'name_of_your_first_column' 
df_exclude = df.select([cols for cols in df.columns if cols not in first_col]).collect()