标签: tensorflow distributed
当在kubernetes上通过Tensorflow训练dnn模型时,发现大多数ps的内存成本约为2Gi,但是其中一个具有70Gi以上的内存,另外还有两个约16Gi的内存。不知道原因。
详细信息: tf.min_max_variable_partitioner创建分区程序,并在tf.get_variable()中用于辅助放置变量