我总是使用漂亮的汤和lxml.html来解析python中的html,但现在我面临着编写一个仅在标准库上运行的脚本。什么是下一个最好的模块/技术?
我已经准备好接受它会相对较差,即使我将失去使用CSS选择器的能力(哭!)问题是我需要它在任何旧的虚拟主机上运行它们只有标准库。
或者我可以手动安装lxml和lxml.html模块吗?即将/ usr / share / pyshared / lxml文件夹复制到我的服务器并使用sys.path.insert让我的脚本看到它?这很丑陋,但没有重写我的代码来解析html而没有两个事实上的标准库!
我还没有尝试但是我怀疑你在共享托管服务器上获得的shell将允许我以更传统的方式安装python模块:使用“python setup.py install”或pip但是如果你知道否则请告诉我。
干杯,
罗杰 - 伦敦
答案 0 :(得分:2)
试试virtualenv,您可以随意安装软件包。
cd ~
wget https://raw.github.com/pypa/virtualenv/master/virtualenv.py
python virtualenv.py newenv
cd newenv
source bin/activate
pip install lxml