从Pandas Dataframe列中以字符串形式提取JSON对象列表

时间:2018-06-13 05:17:04

标签: python pandas dictionary

我有一个完全正常的pandas数据框,我在加载此数据集后创建:https://www.kaggle.com/tmdb/tmdb-movie-metadata/data

正如您所看到的,genres列包含一个嵌套结构,它似乎是一个字典列表,或者json对象,具体取决于您的看法?这些词典的键是'id'和'name'。

无论如何,我已经尝试了一切,包括使用tojson()将列转换为json,或者使用pandas json_normalize()方法,但没有任何运气。

如果我使用json_normalize(),我会得到一个AttributeError:'str'对象没有属性'itervalues':

pd.io.json.json_normalize(obj_movies['genres'], meta = ['id','name']) 

实际上,我的目标是解析这个列表,为每一行创建一组独特的流派名称......

1 个答案:

答案 0 :(得分:1)

使用:

org.hibernate.impl.SessionImpl