使用tensorflow对象检测API创建数据集的xml到csv转换

时间:2018-05-30 10:24:07

标签: xml csv tensorflow

我正在尝试将xml文件转换为csv文件。以下是我到目前为止所尝试的内容:

import os
import glob
import pandas as pd
import xml.etree.ElementTree as ET


def xml_to_csv(path):
    xml_list = []
    for xml_file in glob.glob(path + '/*.xml'):
        tree = ET.parse(xml_file)
        root = tree.getroot()
        for member in root.findall('object'):
            value = (root.find('filename').text,
                     int(root.find('size')[0].text),
                     int(root.find('size')[1].text),
                     member[0].text,
                     int(member[4][0].text),
                     int(member[4][1].text),
                     int(member[4][2].text),
                     int(member[4][3].text)
                     )
            xml_list.append(value)
    column_name = ['filename', 'width', 'height', 'class', 'xmin', 'ymin', 'xmax', 'ymax']
    xml_df = pd.DataFrame(xml_list, columns=column_name)
    return xml_df


def main():
    image_path = os.path.join(os.getcwd(), "/examples/xmlfiles")
    xml_df = xml_to_csv(image_path)
    xml_df.to_csv('1.csv', index=None)
print('Successfully converted xml to csv.')

main()

我保留了我的xml文件命名" 1.XML" in" currdir / examples / xmlfiles"我的python脚本在" currdir"。当我运行这个脚本时,它显示"成功将xml转换为csv"但我看到没有任何名为1.csv的文件。 我在这做错了什么。提前谢谢。

1 个答案:

答案 0 :(得分:1)

我怀疑它无法找到xml文件或无法转换它们,将print语句放入代码并验证

基于代码,文件1.csv应该位于您从中调用python脚本的当前目录中。 但是你可以在命令中指定一个不同的位置并将其保存在那里,如下所示...在你的操作系统上找到特定的确切相对路径的方法,它是“/ examples / xmlfiles”或只是“examples / xmlfiles” xml_df.to_csv('examples / xmlfiles / 1.csv',index = None)