直接LXML或PyQuery

时间:2011-11-14 23:50:26

标签: jquery python screen-scraping lxml pyquery

有没有人有使用直接lxml和PyQuery的经验。我刚刚遇到了后者,并对此很感兴趣。我还没有找到很多关于该库的评论,所以我很好奇它是多么强大。

我熟悉lxml,一般都喜欢它。但是,使用jQuery选择器语法会很好。

开关值得吗?

谢谢!

2 个答案:

答案 0 :(得分:3)

只有你能回答是否值得的问题。

它只取决于你是否想要使用额外的依赖来获取jQuery的自定义CSS选择器。

以下是jQuery在标准CSS选择器之上添加的内容:http://api.jquery.com/category/selectors/jquery-selector-extensions/

以下是PyQuery中这些选择器到普通CSS选择器的转换:https://bitbucket.org/olauzanne/pyquery/src/c2bf08a8f4e7/pyquery/cssselectpatch.py

我不明白为什么它应该比使用lxml的普通CSS选择器更不健壮。它只是将特殊的jQuery选择器转换为CSS选择器。

答案 1 :(得分:3)

lxml supports XPath,类似于CSS选择器。 那会满足你的需求吗?