我正在使用MovieLens10M数据集并希望获得一些可视化...简而言之,我的代码看起来像这样:
import numpy as np
import matplotlib.pyplot as plt
M= np.random.randint(2, size=(70000,10000))
plt.figure(figsize = (2,1), dpi=5)
plt.imshow(M,interpolation='nearest')
plt.axis('off')
plt.savefig('pic.png',dpi=5)
矩阵在内存中占用大约6GB,但是一旦调用savefig,所需的内存就会爆炸 - 在我停止脚本之前它会上升到20GB。设置dpi = 5并且数字这么大只是绝望的尝试得到一些输出..
是否有可能告诉savefig函数它不必进行这样的模糊或我真的需要,例如,样本?