自动从图表中提取数据

时间:2014-02-27 11:15:49

标签: graph extraction

我的图表如下:

enter image description here

我想生成一组(x,y)对,对应于该图的点。

每个水平像素可能有一个。

我将如何做到这一点?

如果我的图像采用未压缩的位图格式,可能会裁剪为实际的图形,我可以检查每个垂直条带的最黑点......

我更喜欢使用Python,但我对任何技术感兴趣。

1 个答案:

答案 0 :(得分:0)

我回答了这样一个问题。检测网格应该相当容易,从那里你可以得到相对于网格的像素坐标。但是,目前尚不清楚如何提取数字,为了获得网格的规模,您需要这样做。虽然,如果你可以匹配字体和字体大小(通过缩放可能是可能的),可能相当容易。否则,您必须手动输入数字。

要提取网格,您将从右上角开始并沿对角线移动,直到找到网格的开头。从那里你可以跟随(网格的)垂直和水平线直到它们结束。这应该允许你以相当高的概率说出网格的外部矩形是什么,以及网格的x和y间隔是以像素为单位的。网格中最黑的部分应该用于查找曲线,但可能需要一些插值,具体取决于您需要/想要的数据点数。

研究逆转抗锯齿效果的技术也很有用。虽然,未压缩的位图图像可能不需要它。