我想从HTML中提取数据。 我只需要提取数据属性的值 不是整个div或文本的内容
示例:
<div class="c-rating-stars c-product-card__rating-stars " data-value="3.333333">
我只需要提取 3.333333 值
这是我的代码
require 'rails'
require 'mechanize'
require 'nokogiri'
require 'open-uri'
require 'csv'
page = Nokogiri::HTML(open("www.url.com"))
page.css('[data-value]').each do |item|
puts item
end
但是我的代码提取了div中的所有内容
答案 0 :(得分:1)
试试这个:
doc = Nokogiri::HTML(open("[insert URL here]"))
dataVvalue = doc.css('div.c-rating-stars')[0]["data-value"]