我正在尝试训练执行图像分割的CNN模型, 但如果我有几个,我很困惑如何创造基本事实 图像样本?
图像分割可以将输入图像中的每个像素分类为 预定义的类,例如汽车,建筑物,人或任何其他类。
是否有任何工具或一些好主意可以创造基础 图像分割的真相?
谢谢!
答案 0 :(得分:2)
答案 1 :(得分:1)
我想到的一个工具是MIT's LabelMe toolbox:这个工具箱主要用于浏览数据集的现有标记图像,但它也可以选择注释新图像。
您可能会觉得有用的this github repository用户界面COCO。
答案 2 :(得分:0)
您可以在整个数据集中使用平均和归一化技术,从而创建基本事实,然后标记不同的结构。为此,您可以考虑创建一个所谓的|模板|。确保您的所有数据最初都进行了共同注册。
答案 3 :(得分:0)
对于语义分割,应标记图像的每个像素。有以下三种解决任务的方法:
基于矢量-多边形,折线
基于像素-画笔,橡皮擦
人工智能工具
在Supervisely中,有执行1,2,3的工具。
下面是两个视频,它们比较了多边形工具和AI工具:cars segmentation和food segmentation。
有关here的有关Supervisely注释功能的更多详细信息。
答案 4 :(得分:0)
我创建了一个名为COCO Annotator的开放源代码工具:它提供了其他工具不足的所有功能:
答案 5 :(得分:0)
SageMaker Ground Truth具有数据集管理和UI,可启用语义分段。 https://aws.amazon.com/sagemaker/groundtruth/
我们最近发布了UI增强功能,可通过自动查找区域边界来显着加快注释速度。在这里阅读:https://aws.amazon.com/blogs/machine-learning/auto-segmenting-objects-when-performing-semantic-segmentation-labeling-with-amazon-sagemaker-ground-truth/
答案 6 :(得分:0)
整体流程是:
注释过程细节
一般来说,首选基于矢量的工具,因为它们更准确。 例如左边是 4 个多边形点,右边是一个画笔。
直观地反击,甚至可以更快地找出点。例如在这里,我只是将鼠标移到记录此内容的轮廓上:
使用其他形状
例如,您可以使用椭圆或圆来创建分割掩码。 无需实际手动创建多边形。
自动边框
想要达到 100% 像素覆盖率背后的主要概念之一是称为自动边框的概念。基本上它只是意味着物体的边缘相交得很好。例如,在 Diffgram 中,您可以选择两个点,它将创建一个匹配的边框。
最后还有许多其他概念,例如预先标记、复制到下一个、跟踪等。
工具
Diffgram 的 Segmentation Labeling Software 是用于图像和视频注释的绝佳工具选项。它是开放式内核,您可以在 your kubernetes cluster 上运行它。