我想在lambda上部署tesseract-OCR。滚动到说适应tesseract 4的部分。我按照本教程构建了tesseract。但是由于构建不是可移植的,因此我面临一个问题。 每当我尝试使用新的Linux实例上的内置实例时,都必须将环境变量PATH设置为/ tmp,否则将无法正常工作。
结构
├── cv2
├── lib
├── numpy
├── PIL
├── pytesseract
├── tessdata
├── tesseract
├── test.png
└── zzz.py
https://s3.amazonaws.com/tesseractstandalone/complete-package.zip
这是独立的tesseract的链接。有一个示例程序zzz.py,其中包含用于运行tesseract的脚本。当我下载zip并将其解压缩到ec2实例中的/ tmp /文件夹时,该程序运行正常。但是在使用lambda时遇到问题。当我尝试将相同的内容下载到lambda / tmp /文件夹时,出现一个错误,提示未安装tesseract或它不在您的路径中。不知道哪里出了问题。不确定是PATH问题还是lambda问题。
答案 0 :(得分:0)
最后得到了AWS帮助的支持。似乎将可执行文件下载到lambda时没有执行权限。解决我对可执行文件执行的chmod 755。