是TensorFlow.JS代码
var N = 1024, A,B;
function init() {
A = tf.randomUniform([N, N]);
B = tf.randomUniform([N, N]);
run()
}
function run() {
var ti0 = performance.now()
const C = A.matMul(B)
var t = C.dataSync()[0];
var ti = performance.now()
document.getElementById('output').innerText = "N = " + N +
" time = " + Math.round(10*(ti - ti0))/10 +
"ms GFLOPS=" + Math.round(N*N*N/(ti - ti0)/10000)/100
}
以https://www.ibiblio.org/e-notes/webgl/gpu/mul/mul_tfjs.htm准确吗? 该脚本在每次重新运行()时都使用虚拟“ C.dataSync()[0]”进行同步。使用“ var t = A.dataSync()[0];”进行的另一项测试仅需约0.2毫秒。但是我无法进行“同步/等待”测试。