我有一张表(保存到其中包含许多数组的数据,并且我想要一个udf循环通过,并将数组的每个元素放入其自己的列中,并将其附加回数据框。
我认为这将成为基础:
def explode_arrays(df):
for a in df.dtypes:
if a[0][:5] == 'array':
flat_df.append(flat_df.explode(flat_df[a]).alias[a])
return df
但是这不会出错,但是没有任何效果。我找不到有人在任何地方这样做的例子。我是否需要将数组存储在列表中并从那里爆炸?
谢谢!