如何使用Rails Nokogiri gem在HTML中提取数据属性?

时间:2017-12-21 08:44:35

标签: html ruby-on-rails ruby nokogiri

我想从HTML中提取数据。 我只需要提取数据属性的值 不是整个div或文本的内容

示例:

<div class="c-rating-stars  c-product-card__rating-stars " data-value="3.333333">

我只需要提取 3.333333

这是我的代码

require 'rails'
require 'mechanize'
require 'nokogiri'
require 'open-uri'
require 'csv'

page = Nokogiri::HTML(open("www.url.com"))

page.css('[data-value]').each do |item|
   puts item
end

但是我的代码提取了div中的所有内容

enter image description here

1 个答案:

答案 0 :(得分:1)

试试这个:

doc = Nokogiri::HTML(open("[insert URL here]"))
dataVvalue = doc.css('div.c-rating-stars')[0]["data-value"]