我目前正在阅读Tensorflow源代码,并对内核的实现感到好奇。我发现大多数gpu实现都指向了Eigen。谁能告诉我tensorflow如何通过Eigen或其他东西使用cuDNN?
答案 0 :(得分:0)
是的,大多数基本内核使用的Eigen使用普通的CUDA。使用cuDNN(例如卷积)的内核会经过以下集成:https://github.com/tensorflow/tensorflow/tree/master/tensorflow/stream_executor/cuda
这是一个Conv内核示例,其中retrieves支持Conv算法(如果已链接和可用,则包括cuDNN),运行chooses the best one,最后uses。