我正在从20000个子集中生成BDD数据集的tfrecords。创建tfrecord时,我为每个tfrecord选择1000张图像,一切都很好。
但是,如果我为每个tfrecord选择500张图像,其中有些(非常罕见)具有TGA类型的图像(image / x-tga)或MATLAB脚本/函数(文本/ x-matlab),而通常它们应该具有Program(应用程序/八位字节流)或二进制文件(应用程序/八位字节流)。
为什么会这样,这是否意味着tfrecords坏了?
feature = self._get_tf_feature(
picture_id, os.path.join(full_images_path, f),
m.group(2), picture_id_annotations, new_format)
example = tf.train.Example(features=feature)
writer.write(example.SerializeToString())