假设我有一组护照图像。我正在做一个项目,必须识别每本护照上的名字,并最终将该对象转换为文本。
在标签的第一部分(或分类(我认为是初学者))中,每本护照上都有名字,我该如何处理?
我可以使用哪些技术/软件来完成此任务?
非常详细,否则任何链接都很好。我试图弄清楚这是如何完成的,所以我可以开始编码
我知道可能会训练模型,但我不确定
如果重要的话,我正在使用Python。
谢谢
答案 0 :(得分:0)
您可以采取两种方法,一种是在数据上标记数据(或者您要标记数据的字段),另一种是没有标记数据的方法。
让我们从后者开始。假设您有护照的图像。您想检测图像中文本的位置以及该文本的内容。您可以使用名为pytessaract
的库来实现。这是一台AI可以为您完成此任务的AI。由于它已经在很多其他图像上进行过训练,因此效果很好,因此可以很好地检测任何图像中的文本。
如果您有标签,也许可以使用pytessaract
进行模型改进,但这要困难许多 。如果您仍然想学习它,我建议您学习ŧensorflow
,并使用“转移学习”来改进您的模型。