我正在从事深度学习项目(图像分割),因此决定将我的工作移至google colab。我上传了笔记本,然后数据使用以下代码安装驱动器
from google.colab import drive
drive.mount('/content/mydrive')
数据采用两个文件夹的格式;一个包含图像(输入数据,.jpg格式),另一个包含其蒙版(地面真相,.png格式),每张2600张图像。我使用以下代码加载它们。
filelist_trainx = sorted(glob.glob('drive/My Drive/Data/Trainx/*.jpg'), key=numericalSort)
X_train = np.array([np.array(Image.open(fname)) for fname in filelist_trainx])
filelist_trainy = sorted(glob.glob('drive/My Drive/Data/Trainy/*.png'), key=numericalSort)
Y_train = np.array([np.array(Image.open(fname)) for fname in filelist_trainy])
在加载X_train时,它不会花费任何时间,但是在运行Y_train时,它会花费很长时间,并且我结束了中断单元格的执行。谁知道为什么会这样?考虑到两个文件都包含相同尺寸的数据,并且存储空间总计为-18 MB。这是图像的样本。 Data sample