我终于有了第二次研究流媒体,守护进程和cron 任务和围绕它们建造的所有整洁的宝石!但我不清楚 如何/何时使用这些东西。
我有几个问题:
1)如果我想让一个网站不断更新,实时,我的Facebook好友的活动供稿,最喜欢的亚马逊书评我喜欢的书和我的推特,我只是使用Daemon gem创建一些自定义流实现,ruby-yali gem用于流式传输内容,以及Whenever gem,可以说,每3-10秒检查一次这些网站,看看我正在寻找的内容是否已经改变?它是如何工作的?或者它通常/最好以不同方式完成?
2)(1)处理器是否过于密集?有没有更好的方法来实现它,这是一种更好的实时内容流媒体方式,因为您想要实时更新的网站没有流媒体API?我正在考虑在一个单独的小红宝石应用程序(带有守护进程和cronjobs)中每隔几秒发送一个请求,获取json / xml结果,使用nokogiri删除我不需要的东西,然后只是通过一小段评论/书籍/帖子/等等,建立一个改变了的东西,并使用Juggernaut或其他东西将这些变化推送到一些rails应用程序。那会有用吗?
我想这一切归结为这个问题:
如何实时流式传输某些网站的最新内容?你怎么做呢? ...如果有人在我的网站上,他们可以实时看到刚出来的新消息或新书?
期待您的回答, 兰斯
答案 0 :(得分:1)
首先,如果一个网站没有提供API,那么它强烈表明解析和提取数据是不合法的,但是你最好检查他们的使用条款和隐私政策。
就我个人而言,我不知道所谓的“Streaming API”,但假设他们有一个API,你仍然需要提取它提供的结果(xml,json,....),解析它们并呈现他们回到用户。该策略将根据您的应用类型而有所不同: