可视化大型数据系列

时间:2012-11-03 22:06:22

标签: matplotlib visualization matlab-figure

我有一个看似简单的问题,但一个简单的解决方案就是暗指我。我有一个非常大的系列(数十或数十万个点),我只需要在不同的缩放级别可视化它,但通常可以很好地缩小。基本上,我想在Matlab或Pyplot这样的工具中绘制它,但是知道每个像素不能代表映射到它的潜在数百个点,我想看到所有像素的最小值和最大值。映射到像素的数组条目,这样我通常可以理解发生了什么。有一种简单的方法吗?

4 个答案:

答案 0 :(得分:3)

试试hexbin。通过设置reduce_C_function我认为你可以得到你想要的。例如:

import matplotlib.pyplot as plt
import numpy as np
plt.hexbin(x,y,C=C, reduce_C_function=np.max) # C = f(x,y)

会给你一个六边形热图,其中像素中的颜色是bin中的最大值。

如果您只想在一个方向上进行装箱,请参阅此this方法。

答案 1 :(得分:1)

您可能想要尝试的第一个选项是Gephi- https://gephi.org/

这是另一种选择,虽然我不太确定它会起作用。没有看到数据就很难说。

尝试访问此链接 - http://bl.ocks.org/3887118。你是否看到了包含所有值的页面底部data.tsv? IF 您可以将数据保存为类似于此,然后上面的HTML代码应该能够在该链接中显示的散点图示例中构建数据。 否则,请尝试访问this链接,将您的数据设计为更合适的网页。

答案 2 :(得分:1)

有一组名为TimeSearcher 1--3的研究工具提供了一些如何处理大型时间序列数据集的示例。以下是TimeSearcher 2和3的一些示例图像。

TimeSearcher 2

TimeSearcher 3

答案 3 :(得分:0)

我意识到MATLAB中的简单plot()实际上给了我更多或更少的东西。缩小时,它会将映射到像素列的所有数据点渲染为集合中从最小到最大的垂直线段,以免模糊函数的实际行为。我使用area()来增加对比度。