我有一个完全正常的pandas数据框,我在加载此数据集后创建:https://www.kaggle.com/tmdb/tmdb-movie-metadata/data
正如您所看到的,genres列包含一个嵌套结构,它似乎是一个字典列表,或者json对象,具体取决于您的看法?这些词典的键是'id'和'name'。
无论如何,我已经尝试了一切,包括使用tojson()将列转换为json,或者使用pandas json_normalize()方法,但没有任何运气。
如果我使用json_normalize(),我会得到一个AttributeError:'str'对象没有属性'itervalues':
pd.io.json.json_normalize(obj_movies['genres'], meta = ['id','name'])
实际上,我的目标是解析这个列表,为每一行创建一组独特的流派名称......
答案 0 :(得分:1)
使用:
org.hibernate.impl.SessionImpl