我需要在项目中使用.npz文件,并且在这样读取文件时使用:
import matplotlib
matplotlib.use('Agg')
import numpy
import random
import matplotlib.pyplot as plt
data = numpy.load('data.npz')
lst = data.files
没有问题发生。但是,一旦我添加了使用它的东西,例如
subset = (data['arr_0'][1:100, :, :, :]
或随机采样(因为它很大(180 000 x 5 x 10 x 10),我只想使用一个子集),所以要花很多时间才能完成。 有没有办法在合理的时间内仅加载第一部分或随机样本?