如何在Windows上使用Bazel 0.19.1编译tensorflow以支持SSE

时间:2019-02-14 15:52:03

标签: python windows tensorflow bazel

我正在构建自己的tensorflow轮,因为我的g4560缺少AVX / AVX2指令集,即使我将GPU用于所有计算(GTX 1050 TI),也无法导入tensorflow(在python中)。

我找到了本教程(链接到Medium网站:LINK),用于从具有SSE4.1和/或SSE 4.2支持的源代码构建tensoflow,并消除了我的CPU具有AVX / AVX2指令集的需求导入张量流。

因此,在我配置构建设置时,特别是构建指令集会提示我:

  

请指定在bazel编译期间要使用的优化标志   指定了选项“ --config = opt” [默认为/ arch:AVX]:

这是当我遇到麻烦时,我在这里尝试了很多事情:

  1. -march = native:仅启用当前计算机上存在的指令集。
  2. -msse4.2:专门用于SSE4.2指令集。
  3. -msse4.1:专门用于SSE4.1指令集。
  4. -SSE:试试看

但是所有这些我都会收到如下警告:

  

命令行警告D9002:忽略未知选项'-msse4.2'

     

命令行警告D9002:忽略未知选项'-msse4.1'

但是,如果我尝试(通过具体说明)/ arch:AVX,它将开始构建而没有任何警告。

因此,我的问题是,如果我要使用SSE4.1或SSE4.2指令集而不是AVX,则应为该提示输入正确的术语。

感谢阅读我的查询。

下面,我发布了.tf_configure.bazelrc文件的简化内容,以供您查看:

 build --action_env PYTHON_BIN_PATH="C:/Users/mania/tensorflow-gpu 
 v1.12/Scripts/python.exe"
 build --action_env PYTHON_LIB_PATH="C:/Users/mania/tensorflow-gpu- 
 v1.12/Lib/site-packages" 
 build --python_path="C:/Users/mania/tensorflow-gpu- 
 v1.12/Scripts/python.exe" 
 build --define with_ignite_support=true 
 build:xla --define with_xla_support=true 
 build --action_env TF_NEED_OPENCL_SYCL="0" 
 build --action_env TF_NEED_ROCM="0" 
 build --action_env TF_NEED_CUDA="1" 
 build --action_env CUDA_TOOLKIT_PATH="C:/Program Files/NVIDIA GPU Computing 
 Toolkit/CUDA/v9.0" build --action_env TF_CUDA_VERSION="9.0"
 build --action_env CUDNN_INSTALL_PATH="C:/Program Files/NVIDIA GPU 
 Computing Toolkit/CUDA/v9.0" 
 build --action_env TF_CUDNN_VERSION="7"
 build --action_env TF_CUDA_COMPUTE_CAPABILITIES="6.1" 
 build --action_env TF_CUDA_CLANG="0" 
 build --config=cuda test --config=cuda 
 build:opt --copt=SSE 
 build:opt --define with_default_optimizations=true 
 build --config monolithic 
 build --copt=-w --host_copt=-w 
 build --verbose_failures 
 build --distinct_host_configuration=false 
 build --experimental_shortened_obj_file_path=true 
 build --define=no_tensorflow_py_deps=true 
 build --define=override_eigen_strong_inline=true 
 build:v2 --define=tf_api_version=2

0 个答案:

没有答案