我正在使用Linux DSVM映像:microsoft-dsvm linux-data-science-vm-ubuntu linuxdsvmubuntu
我的python代码在第一行import pandas as pd
失败,出现python错误,找不到模块。
当我将SSH远程连接到该节点并运行pip install pandas
时,它会告诉我它已经安装。同样适用于numpy等。
我尝试使用/bin/bash -c "pip install pandas"
等设置启动任务,但是由于找不到命令pip
而失败。
再次从SSH shell pip运行时,PATH上没有问题。
有人能指出我正确的方向吗?
Microsoft的简单教程可以正常工作,因为它们不依赖任何外部程序包。所以我能够将我的python文件和数据集等从blob存储上传到机器上。并且python运行正常。就像所有数据科学特定的软件包一样,任务运行时会丢失pip,但是当我通过SSH进入节点时,pip就消失了。
奖金问题,jupyter是否应该在端口8000上运行?
答案 0 :(得分:0)
首先,您必须在计算节点中安装pip。
bin/bash -c "sudo apt-get -y update && export DEBIAN_FRONTEND=noninteractive && sudo apt-get install -y python3-pip && sudo pip3 install pandas;"
将此命令作为启动任务提供给azure批处理池,它将在您的虚拟机中安装pip和pandas。
以同样的方式将要安装的所有库放入require.txt中,并在安装pip后提供sudo pip3 install -r requirements.txt
。