标签: python python-3.x numpy avx
我的项目在算法中大量使用logsumexp。当前,我正在使用此库https://github.com/rmcgibbo/logsumexp,该库在SSE指令集中实现。
logsumexp
但是,现代的Intel CPU具有功能强大的AVX指令集。因此,我想知道AVX甚至CUDA for Python是否有更快的logsumexp实现?
谢谢。