使用Nokogiri查找包含[]的标记

时间:2009-08-05 21:09:59

标签: ruby-on-rails nokogiri

我有一个像html元素:

<div id="spam[500]">

我想通过id搜索这个元素,但似乎nokogiri被[]弄糊涂了。我在尝试:

doc.css("#spam[#{eggs.id}]")

但无济于事。

3 个答案:

答案 0 :(得分:14)

克里斯,试试这个,让我知道它是否有效:

doc = Nokogiri::HTML(page)
el = doc.xpath("//div[@id='spam[500]']").first

问题是您无法通过CSS访问它(即使在浏览器中)。尝试为“spam [500]”设置一些CSS属性,但不会应用它们。但是,您可以通过xpath访问,如上所示。

答案 1 :(得分:1)

这里真正的问题是字符[和]在HTML4(或XML)id属性中是非法的 - 请看以下内容:

http://www.w3.org/TR/html401/types.html#type-name

(有关id属性的规范性定义,请参阅www.w3.org//TR/html401/struct/global.html#adef-id)

答案 2 :(得分:1)

你也可以这样做

el = doc.xpath("id(spam[500])").first

对于具有id的元素,您可以通过id直接调用它们,因为它始终是唯一的。

找出xpath,请在firefox中添加一个'xpath checker'插件。它有很多帮助,非常容易