如何使用Python从图像中提取税款?

时间:2017-08-14 15:43:25

标签: python ocr

作为一个很酷的项目,我试图从税收收据的图像中提取所缴纳的税款总额:

Tax Receipt

我想解析这张图片(以及其他类似图片),并希望提取税额。

[383.58,0.53,0.53, 383.58]

有人能给我带来开始吗?我尝试从OCR开始并使用了一些免费的在线OCR程序,但它们似乎都没有正确读取数据。

如何解决这个问题?到目前为止,我已尝试过在线OCR。哪种引擎最适合此目的,哪些是要记住的关键事项?

python中有很好的库可以帮助我入门吗?

我使用Tesseract-OCR尝试了在线程序,他们没有正确读取数字。我的预感是修补这个引擎的参数应该有所帮助,但我试图了解哪些参数可以帮助以及从哪里开始。

我只是从这些事情开始,所以试图找到自己的方式,而不必理解潜在的技术细节。

1 个答案:

答案 0 :(得分:1)

Tesseract-OCR是一个值得尊敬的开源OCR库。虽然它是用C ++编写的,但是有许多涉及使用Python的包装器的文档。