我使用Feedjira Gem(Rails)从多个网站获取/获取rss-feeds。一切都运行正常,但唯一让我长时间困扰的是源代码(我从中获取rss的网站)。
我想向用户显示rss来自哪个网站。现在,我抓住整个网址,但我想只抓住www之前和.com之前的内容。无论如何,我可以让它工作,或者我可以从rss文件中获取源代码。
我在rss文件中看到了这个,但是无法抓住它。
<channel>
<link>http://www.domain.com/</link>
这是我的整个模特。
class FeedEntry < ActiveRecord::Base
acts_as_punchable
def self.update_from_feed(feed_url)
feed = Feedjira::Feed.fetch_and_parse(feed_url)
add_entries(feed.entries)
end
private
def self.add_entries(entries)
entries.each do |entry|
unless exists? :guid => entry.id
create!(
:name => entry.title,
:url => entry.url,
:guid => entry.id,
:source => entry.url,
:summary => entry.summary,
:published_at => entry.published,
)
end
end
end
end
提前致谢!
答案 0 :(得分:0)
您可以通过
获取来源feed = Feedjira::Feed.fetch_and_parse(feed_url)
source = feed.url # -> http://www.domain.com/
要抓住www之前和.com之前的内容,你可以做类似的事情
source = URI.parse(feed.url).host.split('.')[-2] # -> domain
现在,我们走了
def self.update_from_feed(feed_url)
feed = Feedjira::Feed.fetch_and_parse(feed_url)
source = URI.parse(feed.url).host.split('.')[-2]
add_entries(feed.entries, source)
end
private
def self.add_entries(entries, source)
entries.each do |entry|
unless exists? :guid => entry.id
create!(
:name => entry.title,
:url => entry.url,
:guid => entry.id,
:source => source,
:summary => entry.summary,
:published_at => entry.published,
)
end
end
end
它会起作用!