如何使用Nokogiri从元素中解析部分字符串值? RUBY,机械化

时间:2011-06-23 04:03:37

标签: ruby nokogiri mechanize

如何从字符串中提取数字? 如果xpath是'td [5] p / @ title'

HTML:

<td valign="top" align="center">
  <p title="6 en su sucursal" style="margin-top: 0px; margin-bottom:0px; cursor:hand">   
   <b>10</b>
  </p>
</td>

我需要从title属性string-value“6 en su sucusal”中提取仅6号

1 个答案:

答案 0 :(得分:0)

html内部提供一些HTML,您可以执行以下操作:

doc     = Nokogiri::HTML(html)
numbers = doc.xpath('//p[@title]').collect { |p| p[:title].gsub(/[^\d]/, '') }

然后你将获得numbers数组中的数字。您必须调整XPath和正则表达式以匹配您的实际数据,但基本技术应该是明确的。

Nokogiri documentation and tutorials的一些时间可能会很有成效。