我有一个numpy数组,有400万个样本,每个样本有4 x 40个数据点。我需要创建400万个图表,每个图表包含4个单独的子图。我正在使用matplotlib,代码如下:
sed 's/<div[^>]*>/'\''Title: /;s/<\/div>/'\''/'
我正在使用带有36个CPU内核的计算机上的36个进程的Python多处理来运行它。但经过10多个小时的运行,它只产生了4万个中的4万个图像。对我来说太慢了。我认为I / O操作可能是一个瓶颈,但机器在SSD上运行,所以看起来不太可能。
有什么建议可以提高这个速度吗?