我有一个简单的数字识别项目,并注意到人们在Python中通常使用两种方法。我的目标是输入PDF文档并在页面的特定位置获取HANDWRITTEN数字。
我看到人们使用opencv
,如this个问题,或scikitlearn
,如this示例所示。我对这两者都不熟悉,并且想知道根据我的预期用法哪一个最容易学习和实现。感谢。
答案 0 :(得分:1)
我建议您同时使用opencv
和scikitlearn
。将PDF转换为图像后,可以使用opencv
进行图像预处理(高斯模糊,阈值处理,侵蚀/扩张滤镜),以便更容易提取数字。然后,您可以使用轮廓跟踪(再次opencv
)来检测各个数字。提取完数字后(假设您有训练集),可以使用scikitlearn
进行分类。