我在Python上退出了新手,并尝试启动脚本
convert_to_tfrecord.py
(神经网络;它应该训练图像的数据集与某些库......)
指令:
现在您已准备好运行TFRecord脚本。运行以下命令 来自tensorflow / models / research目录,并传递给它 以下标志(运行两次:一次用于训练数据,一次用于测试 数据):
python convert_labels_to_tfrecords.py \
--output_path=train.record \
--images_dir=path/to/your/training/images/ \
--labels_dir=path/to/training/label/xml/
为了适应我的操作系统X,我通过python3运行这个脚本...更改脚本名称...并设置目录... 我在我的脚本所在的目录;我的文件夹在哪里;我的图书馆在哪里。 所以在我的情况下:
python3 convert_to_tfrecord.py \
--output_path=train.record \
--images_dir=ENFj/ \
--labels_dir=ENFj/xml/
结果:
Oleksandrs-MacBook-Air:research jaskier$ python3 convert_to_tfrecord.py \
> --output_path=train.record \
Traceback (most recent call last):
File "convert_to_tfrecord.py", line 89, in <module>
tf.app.run()
File "/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/site-packages/tensorflow/python/platform/app.py", line 126, in run
_sys.exit(main(argv))
File "convert_to_tfrecord.py", line 81, in main
for filename in os.listdir(FLAGS.images_dir):
FileNotFoundError: [Errno 2] No such file or directory: ''
Oleksandrs-MacBook-Air:research jaskier$ --images_dir=ENFj/ \
> --labels_dir=ENFj/xml/
“convert_to_tfrecord”代码:
import os
import io
import xml.etree.ElementTree as ET
import tensorflow as tf
from object_detection.utils import dataset_util
from PIL import Image
flags = tf.app.flags
flags.DEFINE_string('output_path', '', 'Path to output TFRecord')
flags.DEFINE_string('images_dir', '', 'Path to directory of images')
flags.DEFINE_string('labels_dir', '', 'Path to directory of labels')
FLAGS = flags.FLAGS
def create_tf_example(example):
image_path = os.getcwd() + '/' + FLAGS.images_dir + example
labels_path = os.getcwd() + '/' + FLAGS.labels_dir + os.path.splitext(example)[0] + '.xml'
# Read the image
img = Image.open(image_path)
width, height = img.size
img_bytes = io.BytesIO()
img.save(img_bytes, format=img.format)
height = height
width = width
encoded_image_data = img_bytes.getvalue()
image_format = img.format.encode('utf-8')
# Read the label XML
tree = ET.parse(labels_path)
root = tree.getroot()
xmins = xmaxs = ymins = ymaxs = list()
for coordinate in root.find('object').iter('bndbox'):
xmins = [int(coordinate.find('xmin').text)]
xmaxs = [int(coordinate.find('xmax').text)]
ymins = [int(coordinate.find('ymin').text)]
ymaxs = [int(coordinate.find('ymax').text)]
classes_text = ['tswift'.encode('utf-8')]
classes = [1]
tf_example = tf.train.Example(features=tf.train.Features(feature={
'image/height': dataset_util.int64_feature(height),
'image/width': dataset_util.int64_feature(width),
'image/filename': dataset_util.bytes_feature(encoded_image_data),
'image/source_id': dataset_util.bytes_feature(encoded_image_data),
'image/encoded': dataset_util.bytes_feature(encoded_image_data),
'image/format': dataset_util.bytes_feature(image_format),
'image/object/bbox/xmin': dataset_util.float_list_feature(xmins),
'image/object/bbox/xmax': dataset_util.float_list_feature(xmaxs),
'image/object/bbox/ymin': dataset_util.float_list_feature(ymins),
'image/object/bbox/ymax': dataset_util.float_list_feature(ymaxs),
'image/object/class/text': dataset_util.bytes_list_feature(classes_text),
'image/object/class/label': dataset_util.int64_list_feature(classes),
}))
return tf_example
def main(_):
writer = tf.python_io.TFRecordWriter(FLAGS.output_path)
for filename in os.listdir(FLAGS.images_dir):
tf_example = create_tf_example(filename)
writer.write(tf_example.SerializeToString())
writer.close()
if __name__ == '__main__':
tf.app.run()
尝试过不同的东西: 1.更新请求(一行+删除“\”,因为如下所述,这是页面的PHP解释器的错误...它使用\ n并忘记隐藏输出文本):
python3 convert_to_tfrecord.py
--output_path=train.record
--images_dir=ENFj
--labels_dir=ENFj/xml
2.“find。-name”.DS_Store“-delete” 再试一次:
文件 “/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/site-packages/PIL/Image.py” 第2543行,在open fp = builtins.open(filename,“rb”) IsADirectoryError:[Errno 21]是一个目录: '/用户/ jaskier /下载/模型/研究/ ENFJ / XML'
答案 0 :(得分:1)
代码设置为将--images_dir
中的所有文件解释为某些图像处理机器。这意味着--images_dir
中的任何非图像资源都会导致脚本中断。
一种解决方案是确保--images_dir
仅包含图像文件(即确保目录不包含XML文件或以。.git
或.DS_Store
开头的文件。< / p>
另一种解决方案是将源代码本身修改为仅适用于图像文件。可以使用这样的东西:
import glob
# only match jpg files in the images_dir
for filename in glob.glob(FLAGS.images_dir + '/*.jpg'):
tf_example = create_tf_example(filename)
# copy the other lines here as needed
答案 1 :(得分:0)
就我而言,这只是一个简单的愚蠢错误:当我手动更改文件夹的名称时:
我在名称后留下了空格-当我用 os 或 glob.glob 调用它时,我得到了:{ {1}}
花了一些时间查找问题之后(甚至更改了一些文件名并删除了一些子文件夹),我回到了文件夹,删除了多余的空间,一切正常。