我现在正在制作移动应用程序。我想找到一个服务,我将上传我定义的对象的图像:飞机,计算机......当用户使用应用程序时,他们会拍摄我已在服务中定义的对象,服务会告诉他/她关于对象信息,例如:Akai的电脑,Akai的笔记本电脑,......
我想知道是否有任何图像识别能够提供数据库,用于输入图像作为样本数据,并提供信息以帮助我实现与否。
谢谢,
答案 0 :(得分:2)
这里有一个重要的权衡因素。有两种情况:
每个类别都有相对少数类别(用户可以为其拍摄图片的对象)和多个示例图片。您有很多机器学习领域的选择(神经网络框架,如 caffe 或 Tensorflow )。但是,如果您希望使用相对较少的示例(每个类别仍应至少有数十个),最简单的方法是使用vize.it之类的外部API,您可以通过网络界面设置类别,让外部托管的图像识别器,并通过REST API访问。
您有多个类别,每个类别只有一个或少数示例。我个人不知道有任何预先解决的问题。我的方法是使用一个预先训练的卷积神经网络来处理图像,使用靠近这个网络顶部的隐藏表示(非常类似于使用例如在automated image captioning - example code)的图像一侧,并训练一个分类器,该分类器采用这种方式处理一对图像并输出 [0,1] 标量,表示如何关闭图像。我有experimented with that approach用于比较句子,效果很好,但我希望你需要一个大数据集。
免责声明:我是vize.it的合着者。
答案 1 :(得分:0)
当用户使用该应用时,他们会拍摄我已在服务中定义的对象,该服务会告诉他/她有关对象的信息,例如:Akai的电脑,Akai的笔记本电脑,...
由于您的用户正在尝试识别对象的实例,并检索有关它的元数据,因此Watson Visual Recognition服务的相似性搜索功能可能非常合适。这是一项测试版服务,目前是免费的。
您可以将带有相关元数据的照片(如字符串" Akai的计算机")添加到一个集合中,该集合通过视觉外观对图像进行索引。然后,您可以使用" find_similar"来查询集合。从最直观相似的图像中检索图像ID和元数据的方法。
以下是演示:https://similarity-search-demo.mybluemix.net/该页面还包含API参考的链接。 Watson VR还包括您可能感兴趣的自定义分类器培训。