Python迭代到sqlContext Spark RDD

时间:2019-07-14 16:57:05

标签: python pandas pyspark

有一列名为 'data' 的json。 我运行下面的代码,以从字典(如专栏)中获取键。

data: {"eh": "\\u0130ro", "eb": "Elbise", "ea": "18806421", "gd": "122403", "eq": 793.5}}

keys = set()
for i, row in events_df.iterrows():
    try:
        row_keys = list(row['data'].keys())
        for key in row_keys:
            keys.add(key)
    except:
        keys.add('x')  
for key in keys:
df_[key] = df_['data_json'].apply(lambda d: d.get(key, None))

我想将相同的代码应用于Spark上的RDD。如何以相同的意图使用地图功能?

获得 enter image description here

0 个答案:

没有答案