出于好奇,我试图看看是否可以使用jQuery来读取HTML文件,以便我可以使用它来输出某些html元素的某些值?我正在寻找一些功能,比如Firebug提供的功能,即Firebug允许我在任何网页上使用$()
,所以我想要实现的是:
因此可能使用Python加载每个文件,然后使用jQuery以某种方式解析HTML。我不知道用于描述此要求的正确术语,但有任何建议吗?也许我正在寻找一个命令行jQuery执行引擎?
修改
或许我正在寻找提供$()
功能的脚本语言。我看着Beautiful Soup,但我仍然对jQuery的功能感到好奇。
答案 0 :(得分:3)
也许我会得到另一个答案,但我刚刚找到了最接近的答案:
http://pypi.python.org/pypi/pyquery
截至目前看起来很棒。
答案 1 :(得分:1)
也许看看lxml
? lxml.cssselect
子模块允许您以与jQuery选择器非常相似的方式选择对象。
答案 2 :(得分:1)
如果您正在使用python,那么可能美丽的汤是更好的解决方案
答案 3 :(得分:0)
我已经非常成功地使用PHP: dom来抓取网页了。对于简单的数据提取,getElementById和getElementByTagName通常足够强大。