有一列名为 'data' 的json。
我运行下面的代码,以从字典(如专栏)中获取键。
data: {"eh": "\\u0130ro", "eb": "Elbise", "ea": "18806421", "gd": "122403", "eq": 793.5}}
keys = set()
for i, row in events_df.iterrows():
try:
row_keys = list(row['data'].keys())
for key in row_keys:
keys.add(key)
except:
keys.add('x')
for key in keys:
df_[key] = df_['data_json'].apply(lambda d: d.get(key, None))
我想将相同的代码应用于Spark上的RDD。如何以相同的意图使用地图功能?