是否可以使用jQuery进行HTML解析?

时间:2010-10-31 04:47:49

标签: jquery html parsing html-parsing

出于好奇,我试图看看是否可以使用jQuery来读取HTML文件,以便我可以使用它来输出某些html元素的某些值?我正在寻找一些功能,比如Firebug提供的功能,即Firebug允许我在任何网页上使用$(),所以我想要实现的是:

  • 我有一堆HTML文件
  • 我需要加载每一个并使用jQuery,我想提取一些与HTML元素有关的信息

因此可能使用Python加载每个文件,然后使用jQuery以某种方式解析HTML。我不知道用于描述此要求的正确术语,但有任何建议吗?也许我正在寻找一个命令行jQuery执行引擎?

修改 或许我正在寻找提供$()功能的脚本语言。我看着Beautiful Soup,但我仍然对jQuery的功能感到好奇。

4 个答案:

答案 0 :(得分:3)

也许我会得到另一个答案,但我刚刚找到了最接近的答案:

http://pypi.python.org/pypi/pyquery

截至目前看起来很棒。

答案 1 :(得分:1)

也许看看lxmllxml.cssselect子模块允许您以与jQuery选择器非常相似的方式选择对象。

答案 2 :(得分:1)

如果您正在使用python,那么可能美丽的汤是更好的解决方案

http://www.crummy.com/software/BeautifulSoup/

答案 3 :(得分:0)

我已经非常成功地使用PHP: dom来抓取网页了。对于简单的数据提取,getElementById和getElementByTagName通常足够强大。