在Ruby中使用Nokogiri错误地解析xml

时间:2012-06-22 03:42:13

标签: ruby xml xml-parsing nokogiri

我正在使用Nokogiri解析来自last.fm的XML响应。我目前正在返回我想要的信息,但不是我想要的格式。我得到的似乎是一个Nokogiri :: XML文档。我想要的是每<track>行,包括歌曲的标题,艺术家和网址。以下是XML的示例:

<lfm status="ok">
  <toptracks metro="Beijing" page="1" perPage="50" totalPages="10" total="500">
    <track rank="1">
      <name>Rolling in the Deep</name>
      <duration>226</duration>
      <listeners>33</listeners>
      <mbid>092a88bc-af0b-4ddd-a3a1-17ad37abfccb</mbid>
      <url>
        http://www.last.fm/music/Adele/_/Rolling+in+the+Deep
      </url>
      <streamable fulltrack="0">1</streamable>
      <artist>
        <name>Adele</name>
        <mbid>1de93a63-3a9f-443a-ba8a-a43b5fe0121e</mbid>
        <url>http://www.last.fm/music/Adele</url>
      </artist>
      <image size="small">http://userserve-ak.last.fm/serve/34s/55125087.png</image>
      <image size="medium">http://userserve-ak.last.fm/serve/64s/55125087.png</image>
      <image size="large">http://userserve-ak.last.fm/serve/126/55125087.png</image>
      <image size="extralarge">
        http://userserve-ak.last.fm/serve/300x300/55125087.png
      </image>
    </track>
  </toptracks>
</lfm>

以下是我正在使用的代码:

doc = Nokogiri::HTML(open(url))

doc.xpath("//toptracks").each do |track|
  song_title = track.xpath("*/name").text
  song_lastfm_url = track.xpath("*/url").text
  song_artist = track.xpath("*/artist/name").text

  puts "#{song_title} - #{song_lastfm_url} - #{song_artist}"
end

正如我所提到的,虽然我得到了所有的歌曲标题,然后是所有的歌曲网址,然后是所有的歌曲艺术家作为一个XML文档。

1 个答案:

答案 0 :(得分:2)

你并没有像你想象的那样遍历音轨。试试这样:

doc.xpath('//toptracks/track').each do |track|
  song_title, song_lastfm_url, song_artist = track.xpath('./name','./url','./artist/name').map{|x| x.text.strip}
end