Question

我是刚刚开始使用python的python spark的新手，如果这个问题真的很暗淡，我深感歉意

如何使用列号引用而不是列名删除列或对python spark数据框重新排序？我的校名很长，而且校校名很多，使用名称很繁琐

我想转身，例如：

 Data = Data.drop("070_thing", "230_anglething", "152_magnetthing", "200_status_thing", "155_thing")

进入：

  Data = Data.drop(1, 5, 9, 15, 22)

也要重新排序，所以不要：

 df = df.select("id","name","time","city")

我要放：

 df = df.select(4, 3, 2, 1)

谢谢

Answer 1

您可以使用df.columns：

columns = Data.columns
Data.select(columns[0], columns[1])

或：

  from operators import itemgetter

  df_getter = lambda cols: list(itemgetter(**cols, columns))
  data.select(*df_getter((1, 2, 3)))