无法获取CSS项目

时间:2014-02-08 13:13:57

标签: html css nokogiri

我从http://www.franceculture.fr/programmes#/2014-01-26

收到广播时间表时遇到了困难

我的代码是:

require 'rubygems'  
require 'nokogiri'  
require 'open-uri' 
file=File.open('/Users/hubertus/Dropbox/Apps/Drafts/radio/franceculture-2014-01-29-17-10- 34.txt', 'r')
url=file.readline
target=file.readline

f = File.open('/Users/hubertus/Desktop/output.txt', 'w') 

doc = Nokogiri::HTML(open(url))  
doc.css(".actionnable").each do |item|  
#puts item
heure = item.at_css(".plage").text 
text = item.at_css("a").text 
description = item.at_css(':nth-child(3)').text
link =item.at_css('a')[:href]

f.puts "#{heure} - #{text} -#{description} - #{link}"  
end 
f.close
namesarr=File.read('/Users/hubertus/Desktop/output.txt').split(/\n/)
puts namesarr.select{ |i| i < target }.max
file.close

我想得到后面的C​​SS项目,如下面的HTML,我想得到第二个链接(href:/ emission-un-autre-jour-est-possible-pixar-%C2%AB-25 -ans-d%E2%80%99animation-exposition-metamorphoses-de-la-foret-) 和它的标题(皮克斯«25 ans d'animation'博览会为人们提供:s&gt;皮克斯«25 ans d'animation'博览会/Métamorphosesdelaforfortt guyanaise:série)

<li class="actionnable">
<span class="plage">06:00</span>
<h2><a href="/emission-un-autre-jour-est-possible-0" title="Un autre jour est possible ">Un autre jour est possible </a></h2>

<p> Production : Tewfik Hakem.  Réalisation : Thomas Dutter. </p>
<img src="/sites/all/themes/franceculture/images/down.png" width="20" height="20"  alt="déplier/replier" class="action"><ul>
  <li>
  <span>06:00</span><a href="/emission-un-autre-jour-est-possible-pixar-%C2%AB-25-ans- d%E2%80%99animation-exposition-metamorphoses-de-la-foret-" title="Pixar « 25 ans d’animation  " exposition m de la for guyanaise : s>Pixar « 25 ans d’animation  "Exposition / Métamorphoses de la forêt guyanaise  : série</a>
  <p>
  </p>
  </li>
    </ul>
  <div class="clearer"></div>
  </li>

有没有人知道如何使用CSS选择器来获取它?

0 个答案:

没有答案