在pdf文件中查找要输出的区域

时间:2013-05-17 10:21:41

标签: ruby pdf pattern-recognition

问题:我有一些税务报告的扫描版本(例如https://docs.google.com/file/d/0B3TmJsb1vYhqclFFendvTlRoV28/edit?usp=sharing),我必须以程序方式填写。所以,它需要找到空白区域并在程序中加入一些值。 现在我只看到一个解决方案 - 手动查找这些空白区域的坐标,将其编码为编程,并将值输出到这些坐标。 是否有可能通过编程找到空白区域的坐标(可能通过某种模式识别或其他方式)?可能会使用一些Ruby工具(例如Prawn)?

1 个答案:

答案 0 :(得分:0)

因此,没有完整的自动解决方案。我通过搜索输入区域,存储其坐标然后输出到这些区域来解决这个问题