Nokogiri选择了太多的文字

时间:2012-07-20 14:50:38

标签: ruby-on-rails ruby regex nokogiri

使用Nokogiri和Ruby,我试图使用CSS选择器解析街道地址。然而,它也包括我不想要的城市。

以下是我正在使用的声明:

address = listing.at_css(".address").text

这是HTML:

<div class="address">
  117/1 Main St ,
  <span class="green">
  <strong>
   <u>
    <a href="city">Chicago</a>
   </u>
  </strong>
  </span>

我想要的结果:

117/1 Main St

但结果我得到了:

117/1 Main St , Chicago \n

我在考虑将正则表达式与Nokogiri结合使用,但我不确定Ruby是否可以在" ,"之后删除所有内容,包括返回删除" , "

1 个答案:

答案 0 :(得分:1)

返回117/1 Main St ,(带空格和逗号):

listing.at_css(".address").child.text

这会返回117/1 Main St(删除空格和逗号):

listing.at_css(".address").child.text.sub(/ ,$/,"")