在分布式张量流中涉及按实例梯度时性能降低

时间:2018-08-28 03:10:48

标签: python c tensorflow

试图使用FtrlOptimizer来完成一项工作。由于tf中的原始impl使用批处理渐变,因此我自己通过numpy(纯python)执行了一个实例级别,如下所示:

build tf graph()
read_data_res = sess.run()
delta_parameters = plain_python(read_data_res) # ftrl logic here
update_ps_op = sess.run(ops, feed_dict={delta_parameters})

它能按预期工作,但效率不高,我不确定是否有任何方法可以改善这一点。

此外,如果必须更改基础C实现,我需要做多少工作?到目前为止,对此没有太多的想法。

0 个答案:

没有答案