如何仅选择h4标签后面的p标签 - 但不是Nokogiri的儿童?

时间:2012-05-28 20:22:51

标签: ruby nokogiri

我可以使用Xpath或CSS。

我试过了:

my_page.xpath('//h4/p')

但是,这似乎只是p的{​​{1}}个孩子的h4标签。

我正在解析的HTML结构如下所示:

<h4 class="ban">Mon May 28</h4>
<p><a href="http://phoenix.craigslist.org/cph/cpg/3043067349.html">.Net/Java Developers</a> - <font size="-1"> (phoenix )</font></p>
<p><a href="http://phoenix.craigslist.org/cph/cpg/3043066699.html">QA and Business Analysts</a> - <font size="-1"> (Phoenix Metro)</font></p>

还有其他p&amp;页面上的a个元素......但基本上我想要做的是将h4标记中的单词与页面后面的链接相关联(不嵌套在其中)。

感谢。

1 个答案:

答案 0 :(得分:1)

my_page.css("h4 + p")应该有用。

+adjacent sibling selector