Azure Batch数据科学VM python软件包丢失

时间:2018-11-06 12:15:54

标签: python azure azure-batch

我正在使用Linux DSVM映像:microsoft-dsvm linux-data-science-vm-ubuntu linuxdsvmubuntu

我的python代码在第一行import pandas as pd失败,出现python错误,找不到模块。

当我将SSH远程连接到该节点并运行pip install pandas时,它会告诉我它已经安装。同样适用于numpy等。

我尝试使用/bin/bash -c "pip install pandas"等设置启动任务,但是由于找不到命令pip而失败。

再次从SSH shell pip运行时,PATH上没有问题。

有人能指出我正确的方向吗?

Microsoft的简单教程可以正常工作,因为它们不依赖任何外部程序包。所以我能够将我的python文件和数据集等从blob存储上传到机器上。并且python运行正常。就像所有数据科学特定的软件包一样,任务运行时会丢失pip,但是当我通过SSH进入节点时,pip就消失了。

奖金问题,jupyter是否应该在端口8000上运行?

1 个答案:

答案 0 :(得分:0)

首先,您必须在计算节点中安装pip。

bin/bash -c "sudo apt-get -y update && export DEBIAN_FRONTEND=noninteractive && sudo apt-get install -y python3-pip && sudo pip3 install pandas;"

将此命令作为启动任务提供给azure批处理池,它将在您的虚拟机中安装pip和pandas。

以同样的方式将要安装的所有库放入require.txt中,并在安装pip后提供sudo pip3 install -r requirements.txt

相关问题