如何在python中操作数据矩阵?

时间:2017-04-14 01:00:47

标签: python pandas

我想创建可以读取的代码,从包含电影信息的数据矩阵创建直方图。数据集(矩阵)包含几列,我对包含电影发行年份的列感兴趣,另一列表示它们是否通过了bechtel测试(数据集定义了“Pass”和“Fail”作为指标电影是否通过或未通过测试)。知道这两列的第n列编号(发行年份和通过/失败),如何创建未通过测试的电影的直方图,x轴包含电影年份的二进制位? bin大小不是太重要,无论pyplot默认为没问题。

我能做什么(不是很多)是这样的:

plt.hist(year_by_Test_binary[:,0])

这创造了一个漂亮但毫无意义的直方图,显示多年来在多少年内发布的电影(矩阵在第0列有多年)。

如果你还不能说,我是愚蠢的文盲和挣扎。任何帮助将不胜感激。

2 个答案:

答案 0 :(得分:0)

假设n是Bechdel测试的列,并且您的数据像numpy那样:

plt.hist([matrix[matrix[:,n] == 'Pass', 0], matrix[matrix[:,n] == 'Fail', 0]])

我们正在给两个年代的两个向量,一个有电影传递,一个有电影失败。然后,它将为每个类别创建两个直方图,以便您可以直观地识别类别的更改。

答案 1 :(得分:0)

用于将数据转换为矩阵使用:

numpy.asarray(data)

并在直方图中显示,您可以使用:

plt.plot(data)

plt.hist(data, bins)

bins是您数据的新东西