如何使用Nokogiri从HTML解析多个字符串?

时间:2012-02-21 22:41:55

标签: ruby nokogiri

我需要用Nokogiri解析这个HTML代码,但是在一个变量中保存“Piso en Calle Antonio Pascual”,在另一个变量中保存“Peñiscola”。

<h1 class="title g13_24">
        Piso en  Calle Antonio Pascual
        <span class="title-extra-info">Peñíscola</span>
</h1>

1 个答案:

答案 0 :(得分:0)

require 'nokogiri'
doc = Nokogiri::HTML.parse(<<-HTML)
  <h1 class="title g13_24">
    Piso en  Calle Antonio Pascual
    <span class="title-extra-info">Peñíscola</span>
  </h1>
HTML

h1 = doc.at_css('h1.title')
str1 = h1.children[0].text.strip
# => "Piso en  Calle Antonio Pascual"
str2 = h1.at_css('.title-extra-info').text.strip
# => "Peñíscola"

但坦率地说,Nokogiri文件会告诉你同样的事情。