应用错误收集

pgplot可能直接用行而不是文本绘制文本中的字体。特别是因为pgplot设计用于输出大量设备，包括你必须这样做的绘图仪。

编辑：

如果你有足够的情节值得努力比一个非常简单图像处理任务。转换每个页面到像tiff，单声道的东西 chrome将图像阈值阈值化为二进制，文本将是最大像素值。

使用模板匹配技术。如果你有一套有限的可能的标签然后匹配整个标签，你甚至可以开始使用正确大小的模板和旋转。然后只标记每个绘图包含标签[1-n]，没有需要阅读实际文本。

如果你那么你不知道标签只是，相当容易地做OCR 提取轴周围的区域，将其旋转为垂直 - 并使用 Google的免费OCR库

如果你有pgplot，你甚至可以为OCR建立训练集模板图像直接相反而不是从中收获它们图像列表