我想创建可以读取的代码,从包含电影信息的数据矩阵创建直方图。数据集(矩阵)包含几列,我对包含电影发行年份的列感兴趣,另一列表示它们是否通过了bechtel测试(数据集定义了“Pass”和“Fail”作为指标电影是否通过或未通过测试)。知道这两列的第n列编号(发行年份和通过/失败),如何创建未通过测试的电影的直方图,x轴包含电影年份的二进制位? bin大小不是太重要,无论pyplot默认为没问题。
我能做什么(不是很多)是这样的:
plt.hist(year_by_Test_binary[:,0])
这创造了一个漂亮但毫无意义的直方图,显示多年来在多少年内发布的电影(矩阵在第0列有多年)。
如果你还不能说,我是愚蠢的文盲和挣扎。任何帮助将不胜感激。
答案 0 :(得分:0)
假设n
是Bechdel测试的列,并且您的数据像numpy那样:
plt.hist([matrix[matrix[:,n] == 'Pass', 0], matrix[matrix[:,n] == 'Fail', 0]])
我们正在给两个年代的两个向量,一个有电影传递,一个有电影失败。然后,它将为每个类别创建两个直方图,以便您可以直观地识别类别的更改。
答案 1 :(得分:0)
用于将数据转换为矩阵使用:
numpy.asarray(data)
并在直方图中显示,您可以使用:
plt.plot(data)
或
plt.hist(data, bins)
bins是您数据的新东西