如何从字符串中提取数字? 如果xpath是'td [5] p / @ title'
HTML:
<td valign="top" align="center">
<p title="6 en su sucursal" style="margin-top: 0px; margin-bottom:0px; cursor:hand">
<b>10</b>
</p>
</td>
我需要从title属性string-value“6 en su sucusal”中提取仅6号
答案 0 :(得分:0)
在html
内部提供一些HTML,您可以执行以下操作:
doc = Nokogiri::HTML(html)
numbers = doc.xpath('//p[@title]').collect { |p| p[:title].gsub(/[^\d]/, '') }
然后你将获得numbers
数组中的数字。您必须调整XPath和正则表达式以匹配您的实际数据,但基本技术应该是明确的。
Nokogiri documentation and tutorials的一些时间可能会很有成效。