Cublas如何处理NaNs?当操作具有使用NaN的IEEE 754定义行为时,cublas函数是否始终处理NaN?我特别感兴趣的是他们如何在他们的gemm和批量gemm程序中处理NaNs,据我测试,NaNs的结果符合标准,但是在cuda文档中没有提到这一点,所以我有点有点不确定,正确处理NaN对我的代码的正确性至关重要。
答案 0 :(得分:1)
CUDA GPU应遵循IEEE-754浮点算术规则。
不应该对NaN进行非标准处理。这应该适用于所有使用浮点运算的库,并且不应因函数而异。
This document对GPU使用IEEE-754浮点运算进行了大量讨论。