Amazon EC2实例上的Tensorflow导入错误

时间:2018-10-29 15:21:41

标签: python amazon-web-services tensorflow amazon-ec2

我正在尝试在我的p3.16xlarge Amazon EC2实例中运行卷积神经网络。我使用pip install为我的程序安装了tensorflow和所有其他必需的库,但是,当我运行该程序时,会收到错误消息:

“ ImportError:libcublas.so.9.0:无法打开共享对象文件:没有这样的文件或目录” “无法加载本机TensorFlow运行时。”

这些是我的实例详细信息: Python 2.7.14(默认,2018年5月2日,18:31:34) Amazon Linux AMI 2018.03.0.20180811 x86_64 HVM GP2

在研究该问题时,似乎我需要CUDA 9.0,而大多数Linux机器都使用CUDA 9.1。我如何准确降级CUDA /更改/配置实例以使tensorflow运行?我不知道该怎么做。

谢谢

1 个答案:

答案 0 :(得分:0)

许多客户发现,深度学习AMI是在EC2上运行工作负载的最简单方法。它已预装有所有流行的库。

https://aws.amazon.com/machine-learning/amis/

或者,您可以考虑使用Amazon SageMaker在S3中存储数据,在完全托管的基础架构上进行培训和部署。比管理自己的EC2实例要容易得多:)

https://aws.amazon.com/sagemaker/

我很想听听您的反馈并回答任何问题。