如何从rss供稿条目中获取视频

时间:2017-07-13 13:25:22

标签: ruby-on-rails web-scraping rss feedjira metainspector

我正在尝试从Feed条目网址获取视频(网址)。

我在我的应用程序中使用Feedjira和MetaInspector来获取和存储文章以及图像。现在我想存储文章的视频(如果有的话)。任何人都可以告诉我什么是最好的方式来存储文章中的视频

谢谢。

1 个答案:

答案 0 :(得分:2)

我在我的项目中执行此操作以保存从rss feeds

找到的所有网址
Source.all.each do |source|
  feed = Feedjira::Feed.fetch_and_parse(source.url)
  feed.entries.each do |entry|
    unless Link.exists? url: entry.url
      Link.create!(title: entry.title,
        url: entry.url)
    end
  end
end

在我的代码段中,我只保存了网址和标题,对于您只需添加entry.video的视频,

您可以看到来自feed.entries对象或来自rss的所有条目标记。

如果你想添加其他属性,例如media:thumbnail,你可以在调用fetch_and_parse之前添加此代码,但是每次调用fetch_and_parse时都需要调用它以避免记忆泄漏

Feedjira::Feed.add_common_feed_entry_element("media:thumbnail", :value => :url, :as => :pic)

然后你可以entry.pic来获取缩略图网址