我使用tensorflow训练模型并进行预测,并在ubuntu上使用htop来监控cpu的使用情况。预测很慢,我无法忍受。 htop显示cpu颜色几乎是红色,这意味着几乎所有cpu资源都被系统内核线程使用,但是在tensorflow开始之前cpu使用率是0%。 我没有更改thread_num,我在ubuntu14.04上使用tensorflow v0.11。
答案 0 :(得分:0)
问题是默认的glibc malloc对小分配效率不高。此外,由于Google在内部使用tcmalloc开发/测试张量流,因此与常规malloc的不良交互不会被解决。解决方案是使用tcmalloc运行TensorFlow。
sudo apt-get install google-perftools
export LD_PRELOAD="/usr/lib/libtcmalloc.so.4"
python ...