我正在尝试在我的p3.16xlarge Amazon EC2实例中运行卷积神经网络。我使用pip install为我的程序安装了tensorflow和所有其他必需的库,但是,当我运行该程序时,会收到错误消息:
“ ImportError:libcublas.so.9.0:无法打开共享对象文件:没有这样的文件或目录” “无法加载本机TensorFlow运行时。”
这些是我的实例详细信息: Python 2.7.14(默认,2018年5月2日,18:31:34) Amazon Linux AMI 2018.03.0.20180811 x86_64 HVM GP2
在研究该问题时,似乎我需要CUDA 9.0,而大多数Linux机器都使用CUDA 9.1。我如何准确降级CUDA /更改/配置实例以使tensorflow运行?我不知道该怎么做。
谢谢
答案 0 :(得分:0)
许多客户发现,深度学习AMI是在EC2上运行工作负载的最简单方法。它已预装有所有流行的库。
https://aws.amazon.com/machine-learning/amis/
或者,您可以考虑使用Amazon SageMaker在S3中存储数据,在完全托管的基础架构上进行培训和部署。比管理自己的EC2实例要容易得多:)
https://aws.amazon.com/sagemaker/
我很想听听您的反馈并回答任何问题。