我正在尝试在32个vCPU Google计算实例上运行几个深度学习python / tensorflow脚本。实例创建如下:
gcloud compute instances create dl-trainer \
--zone us-central1-b --image-family tf-latest-cpu \
--image-project deeplearning-platform-release \
--machine-type n1-highcpu-32 --preemptible
由于某种原因,所有python / tensorflow脚本都在32个vCPU中的两个上运行(vCPU#0和#16)
我尝试使用标准的Google计算实例映像进行相同的设置。在这种情况下,负载在vCPU之间平均分配。我正在尝试使用tf-latest-cpu
图片来加快速度。