标签: nvidia tegra
如何从GPU获得浮动操作的最大数量(在触发器中)?
例如,在GK20A GPU上(嵌入在Tegra K1中),它可以达到852 Mhz并拥有192个cuda核心(每个周期只能执行一次基本的fp操作 - 如果我读到{{3}正确)并且可以达到852 Mhz,我的第一个猜测基本上是:852 * 192 = 163 GFLOPS。
然而,Nvidia对Tegra K1至少拥有the specs。我错过了什么?