如何从json批注图像制作tfrecords

时间:2018-06-25 12:20:42

标签: python json tensorflow object-detection object-detection-api

我已经使用tensorflow对象检测API来训练自己的对象检测器。但是那时,图像使用labelimg进行注释,每个图像都会创建xml文件。现在,我得到了带有json的标签图像每个图像的文件。因此我如何使用这些json文件创建tfrecords。

2 个答案:

答案 0 :(得分:2)

首先,我使用自己的脚本创建了csv文件。

import os
import glob
import pandas as pd
import json
import pickle

def json_to_csv():
    path_to_json = 'images/train/'
    json_files = [pos_json for pos_json in os.listdir(path_to_json) if pos_json.endswith('.json')]
    path_to_jpeg = 'images/train/'
    jpeg_files = [pos_jpeg for pos_jpeg in os.listdir(path_to_jpeg) if pos_jpeg.endswith('.jpeg')]
    fjpeg=(list(reversed(jpeg_files)))
    n=0
    csv_list = []
    labels=[]
    for j in json_files:
        data_file=open('images/train/{}'.format(j))   
        data = json.load(data_file)
        width,height=data['display_width'],data['display_height']
        for item in data["items"]:
            box = item['bounding_box']
            if item['upc']!='None':
                name=item['upc']
                labels.append(name)
                xmin=box['left']
                ymin=box['top']
                xmax=box['right']
                ymax=box['bottom']
                value = (fjpeg[n],
                         width,
                         height,
                         name,
                         xmin,
                         ymin,
                         xmax,
                         ymax
                         )
                csv_list.append(value)
          n=n+1
    column_name = ['filename', 'width', 'height', 'class', 'xmin', 'ymin', 'xmax', 'ymax']
    csv_df = pd.DataFrame(csv_list, columns=column_name)
    labels_train=list(set(labels))
    with open("train_labels.txt", "wb") as fp:   #Pickling
        pickle.dump(labels_train, fp)
    return csv_df

def main():
    for directory in ['train']:
        csv_df = json_to_csv()
        csv_df.to_csv('data/{}_labels.csv'.format(directory), index=None)
        print('Successfully converted json to csv.')

main()

然后我使用this脚本创建tfrecords。

答案 1 :(得分:0)

我们在这个主题上有some documentation

请注意,labelimg应产生与我们使用的PASCAL VOC数据集相似的输出,因此这些脚本也可能有用。