Tensorflow SavedModel文件大小随每次保存而增加

时间:2019-04-16 03:20:44

标签: tensorflow tensorflow-serving

我有一个Tensorflow R1.13训练代码,该代码在长时间的训练过程中定期保存SavedModel(我遵循的是该主题的出色article)。我注意到,每次保存模型时,大小都会增加。实际上,它似乎每次都精确地线性增加,并且似乎是初始文件大小的倍数。我想知道TF是否保留对所有以前保存的文件的引用,并为以后的每次保存积累它们。以下是随着训练的进行而按时间顺序写入的几个SavedModel文件的文件大小。

-rw-rw-r-- 1 ubuntu ubuntu  576962 Apr 15 23:56 ./model_accuracy_0.361/saved_model.pb
-rw-rw-r-- 1 ubuntu ubuntu 1116716 Apr 15 23:58 ./model_accuracy_0.539/saved_model.pb
-rw-rw-r-- 1 ubuntu ubuntu 1656470 Apr 16 00:11 ./model_accuracy_0.811/saved_model.pb
-rw-rw-r-- 1 ubuntu ubuntu 2196440 Apr 16 00:15 ./model_accuracy_0.819/saved_model.pb
-rw-rw-r-- 1 ubuntu ubuntu 2736794 Apr 16 00:17 ./model_accuracy_0.886/saved_model.pb
-rw-rw-r-- 1 ubuntu ubuntu 3277150 Apr 16 00:19 ./model_accuracy_0.908/saved_model.pb
-rw-rw-r-- 1 ubuntu ubuntu 3817530 Apr 16 00:21 ./model_accuracy_0.919/saved_model.pb
-rw-rw-r-- 1 ubuntu ubuntu 4357950 Apr 16 00:25 ./model_accuracy_0.930/saved_model.pb
-rw-rw-r-- 1 ubuntu ubuntu 4898492 Apr 16 00:27 ./model_accuracy_0.937/saved_model.pb

有没有办法剔除以前保存的版本?或至少防止它们首先堆积?当然,我只会保留最后一个文件,但它似乎应该比它大10倍。

下面是我的代码(主要从Silva复制):

        # Creates the TensorInfo protobuf objects that encapsulates the input/output tensors
        tensor_info_input_data_1 = tf.saved_model.utils.build_tensor_info(gd.data_1)
        tensor_info_input_data_2 = tf.saved_model.utils.build_tensor_info(gd.data_2)
        tensor_info_input_keep   = tf.saved_model.utils.build_tensor_info(gd.keep  )

        # output tensor info
        tensor_info_output_pred = tf.saved_model.utils.build_tensor_info(gd.targ_pred_oneh)
        tensor_info_output_soft = tf.saved_model.utils.build_tensor_info(gd.targ_pred_soft)

        # Define the SignatureDef for this export
        prediction_signature = \
            tf.saved_model.signature_def_utils.build_signature_def(
                inputs={
                    'data_1': tensor_info_input_data_1,
                    'data_2': tensor_info_input_data_2,
                    'keep'  : tensor_info_input_keep
                },
                outputs={
                    'pred_orig': tensor_info_output_pred,
                    'pred_soft': tensor_info_output_soft
                },
                method_name=tf.saved_model.signature_constants.CLASSIFY_METHOD_NAME)

        graph_entry_point_name = "my_model" # The logical name for the model in TF Serving

        try:
            builder = tf.saved_model.builder.SavedModelBuilder(saved_model_path)
            builder.add_meta_graph_and_variables(
                sess= sess,
                tags=[tf.saved_model.tag_constants.SERVING],
                signature_def_map = {graph_entry_point_name:prediction_signature}
            )
            builder.save(as_text=False)
            if verbose:
                print("  SavedModel graph written successfully. " )
            success = True
        except Exception as e:
            print("       WARNING::SavedModel write FAILED. " )
            traceback.print_tb(e.__traceback__)
            success = False
        return success

2 个答案:

答案 0 :(得分:1)

@赫菲斯托斯,

如果您每次都构建一个SavedModelBuilder,那么每次您save时,它将向该图添加新的保存操作。

相反,您只能构造一次SavedModelBuilder,而只需反复调用builder.save。这不会在每次save调用时向图表添加新的操作。

或者,我认为您可以创建自己的tf.train.Saver并将其传递给add_meta_graph_and_variables。那么它不应该创建任何新操作。

完成图形构建后,tf.get_default_graph().finalize()是一个很好的调试工具,它将引发异常,而不是像这样扩展图形。

希望这会有所帮助。

答案 1 :(得分:0)

为Saver设置clear_extraneous_saver = True

https://github.com/tensorflow/tensorflow/blob/b78d23cf92656db63bca1f2cbc9636c7caa387ca/tensorflow/python/saved_model/builder_impl.py#L382

meta_graph_def = saver.export_meta_graph(        clear_devices = clear_devices,clear_extraneous_savers = True,strip_default_attrs = strip_default_attrs)