应用错误收集

时间：2019-05-08 19:28:47

标签： python machine-learning deep-learning classification

假设我有一组护照图像。我正在做一个项目，必须识别每本护照上的名字，并最终将该对象转换为文本。

在标签的第一部分（或分类（我认为是初学者））中，每本护照上都有名字，我该如何处理？

我可以使用哪些技术/软件来完成此任务？

非常详细，否则任何链接都很好。我试图弄清楚这是如何完成的，所以我可以开始编码

我知道可能会训练模型，但我不确定

如果重要的话，我正在使用Python。

谢谢

答案 0 :(得分：0)

您可以采取两种方法，一种是在数据上标记数据（或者您要标记数据的字段），另一种是没有标记数据的方法。

让我们从后者开始。假设您有护照的图像。您想检测图像中文本的位置以及该文本的内容。您可以使用名为pytessaract的库来实现。这是一台AI可以为您完成此任务的AI。由于它已经在很多其他图像上进行过训练，因此效果很好，因此可以很好地检测任何图像中的文本。

如果您有标签，也许可以使用pytessaract进行模型改进，但这要困难许多。如果您仍然想学习它，我建议您学习ŧensorflow，并使用“转移学习”来改进您的模型。