python for循环中的性能优化

时间:2018-10-30 14:31:01

标签: python optimization conv-neural-network

我正在使用自定义数据集实现CNN,该数据集包含超过10万张图片。这些是名为{code}-{uuid}.png的图像,其中{codes}是图像的不同标签,而{uuid}是唯一的文件标识符。

现在,我编写了一个读取这些图像的函数,从性能的角度来看这是次优的。减慢该功能的核心是我用于读取图像,从文件名解析代码并保存两个数组的double for循环,一个数组用于图像,另一个数组用于对应的标签:

    for code in codes:
        for file in glob.glob(f'features/image_dataset/{code}*.png'):
            labels.append(re.findall(f'{code}', file))
            tmp_ary = np.expand_dims(plt.imread(file), axis=0)
            ary = np.append(ary, tmp_ary, axis=0)

如何改善循环的性能?

0 个答案:

没有答案