我正在尝试绘制直方图,以显示电影数据中genre_ids的频率。由于某些电影具有多种类型,并且看起来像这样,所以数据当前以ID列表的形式存储在pandas数据框列中:
genre_ids
[35]
[18]
[35, 10749]
[18, 10749]
[35, 18, 10749]
如何绘制直方图,使轴上的值仅是流派ID,而不是列表本身?我到处搜索这个问题,无法解决。到目前为止,我只是在使用:
movie_data['genre_ids'].hist()
movie_data是数据帧。我希望直方图看起来像:
x
x x
x x x
35 18 10749
代替:
x
x x
x x x x
[35] [18,35] [18] [18,10749]
例如
答案 0 :(得分:0)
在进行直方图绘制之前,您需要从列表中取出元素。
这应该可以完成工作:
form Pandas import Series
movie_data['genre_ids'].apply(Series).stack().hist()