如何有效标记我的图像分类数据集?

时间:2019-06-03 13:28:09

标签: tensorflow machine-learning dataset label conv-neural-network

我正在对图像分类CNN进行数据处理。我有4种不同的图像:

  • 对比度更高的图像
  • 带有噪点的图像
  • 带有jpeg伪像的图像
  • 未更改的图像。

现在我需要给图像加上标签,以便可以对图像上的问题进行分类并尝试对其进行修复,但是我找不到找到像所有对比度一样选择并添加标签的有效方法。

我已经尝试过labelbox.io之类的Web应用程序,但是使用该应用程序我必须手动处理每个图像,并且图像太多,因此这样做会花费太多时间。

1 个答案:

答案 0 :(得分:0)

您没有提供该信息,但我会认为您的图片名称格式正确,以便知道它们属于哪个类别。

因此,您可以遍历所有数据,如果它们属于某个类别,则将相应的标签保存在列表中,然后将该列表保存在.csv中:

labels = []

for img in os.listdir(IMG_FOLDER):
    if 'contrast' in img:            #if your image name contain 'contrast'
        labels.append((img, 0))
    elif 'noise' in img:
        labels.append((img, 1))
    elif 'jpeg' in img:
        labels.append((img, 2))
    elif 'unchanged' in img:
        labels.append((img, 3))

labels = pd.DataFrame(labels, columns=['name', 'label'])
labels.to_csv('labels.csv', index=False)