我是谷歌应用引擎和python开发环境的新手。但是,我有过c ++,php和objective-c的经验。
我正在尝试编写显示数据的简单html scraper。我知道lxml是解析html的最佳方法。在我的开发环境中,我有python 2.7,我似乎只能安装lxml3.0.1。但是,app引擎支持lxml2.3
希望差异不会太差,我在我的机器上安装了lxml3.0.1。当我调用任何lxml.html解析器函数时,它会尝试从html5lib调用 - 这当然不受app引擎的支持。
从谷歌应用引擎lxml解析html的最佳方法是什么?