如何创建实时屏幕抓取?
喜欢这个网站:www.bog.nu
以下是有关该网站的一些信息:http://casperfabricius.com/site/2010/11/11/launch-bog-nu/
我知道Mechanize。但我不认为它应该适用于Cramp和Eventmachine。
答案 0 :(得分:0)
我不确定问题是什么 - 他们会抓取他们想要抓取的网站,解析HTML并获取他们需要的信息。
我不知道他们是如何分解应用程序的职责的,但是,例如,请参阅this example,了解一种可以获取信息并实时流式传输的方法。这里的信息将转到HTML5页面,但它可以很容易地填充到数据库中,并由常规浏览器请求提供而不是流式传输。