用于Python中数字识别的最简单方法

时间:2017-03-09 18:27:15

标签: python opencv image-processing scikit-learn classification

我有一个简单的数字识别项目,并注意到人们在Python中通常使用两种方法。我的目标是输入PDF文档并在页面的特定位置获取HANDWRITTEN数字。

我看到人们使用opencv,如this个问题,或scikitlearn,如this示例所示。我对这两者都不熟悉,并且想知道根据我的预期用法哪一个最容易学习和实现。感谢。

1 个答案:

答案 0 :(得分:1)

我建议您同时使用opencvscikitlearn。将PDF转换为图像后,可以使用opencv进行图像预处理(高斯模糊,阈值处理,侵蚀/扩张滤镜),以便更容易提取数字。然后,您可以使用轮廓跟踪(再次opencv)来检测各个数字。提取完数字后(假设您有训练集),可以使用scikitlearn进行分类。