我有一个TensorFlow程序,旨在帮助我非正式地对我正在使用的GPU进行基准测试,更重要的是,了解TensorFlow附带的分析工具。代码除了为矩阵设置两个占位符之外什么都不做,然后matmul op调用会话来填充占位符并执行十次图形。
以下是代码:
tf.constant(np.arange(3.0))
当我查看张量板图时会出现两个特点:
答案 0 :(得分:0)
您是否尝试过使用Google网络跟踪框架?这是分析计算和内存使用时间线的先前方法。
这不是您问题的答案,但它是比较并可能隔离问题的好方法。