标签: python python-3.x pytorch profiling flamegraph
我为项目的Dataloader实现了自定义的PyTorch数据集。但是,它的运行速度比预期的要慢,因此选择了性能分析来解决瓶颈。
研究了vprof,但是如果我只想对数据集实现进行分析,我不确定要对该函数进行概要分析。在Ubuntu 18.04上使用PyTorch 1.5和Python 3.7。
我们如何仅对自定义数据集实现执行性能分析(CPU和内存)?
谢谢!