我有一个Spark数据框,我想对除第一列(我想按名称或编号选择)之外的所有列执行array = np.array(df.collect())
。我该怎么办?
答案 0 :(得分:1)
我是这样做的:
obs
答案 1 :(得分:0)
您可以尝试
first_col = 'name_of_your_first_column'
df_exclude = df.select([cols for cols in df.columns if cols not in first_col]).collect()