python - 如何阅读图像文件/机器学习图像识别？

如何阅读图像文件/机器学习图像识别？

时间：2020-07-22 01:17:49

标签： python machine-learning image-processing artificial-intelligence

我当时正在考虑使用python和一些机器学习库（例如keras，tensorflow ...）创建图像识别模型，我想知道是否有人可以启发我推荐用于此类事情的库。（我以前做过图像识别项目，但从未达到我现在计划的规模）。我的计划是能够检测ASL字母和数字，并最终检测单词等。我的第一个障碍是如何将示例图片转换为可读文件（即，黑白相加，且一或零的数组，或者甚至应该这样做）。任何指导将不胜感激。

1 个答案:

答案 0 :(得分：1)

我在Python中知道的大多数计算机视觉应用程序通常使用以下三个选项之一来加载到numpy数组中：

Scikit-Image
OpenCV（注意：读取BGR而不是RGB）
Pillow

如果深度学习是您的目标，PyTorch的{{3}}证明了对Pillow（PIL）的支持，尽管一旦有了numpy数组，使用任何Python图像处理/计算机视觉库并转换成所需的格式都相当容易。对于大多数大型图像处理应用程序，这些都是可行的选择。