使用pythons标准库解析html?或者手动“安装”模块?

时间:2012-11-15 02:25:58

标签: python ssh hosting

我总是使用漂亮的汤和lxml.html来解析python中的html,但现在我面临着编写一个仅在标准库上运行的脚本。什么是下一个最好的模块/技术?

我已经准备好接受它会相对较差,即使我将失去使用CSS选择器的能力(哭!)问题是我需要它在任何旧的虚拟主机上运行它们只有标准库。

或者我可以手动安装lxml和lxml.html模块吗?即将/ usr / share / pyshared / lxml文件夹复制到我的服务器并使用sys.path.insert让我的脚本看到它?这很丑陋,但没有重写我的代码来解析html而没有两个事实上的标准库!

我还没有尝试但是我怀疑你在共享托管服务器上获得的shell将允许我以更传统的方式安装python模块:使用“python setup.py install”或pip但是如果你知道否则请告诉我。

干杯,

罗杰 - 伦敦

1 个答案:

答案 0 :(得分:2)

试试virtualenv,您可以随意安装软件包。

cd ~
wget https://raw.github.com/pypa/virtualenv/master/virtualenv.py
python virtualenv.py newenv
cd newenv
source bin/activate
pip install lxml