我制作了类似于The Pirate Bay,Kickass.to等的bittorrent跟踪器/网站。在索引和torrent页面中检索torrent统计信息(浏览器,下载)是必要的。例如:
http://kat.cr/ubuntu-15-04-vivid-vervet-desktop-amd64-iso-final-t10550003.html
播种机:3442 Leechers:148
如果torrent正在使用我的智能设备,则很容易快速检索这两个网页的数据。但是,如果torrent使用不同的跟踪器,我需要从所述跟踪器中获取其统计信息(向其发出请求),但每个torrent通常需要几秒钟,显然,我无法让用户等待那么久才能看到上市。
我制作了一个脚本,用来刮掉最近在背景中运行的90个种子,但我担心它还不够。该网站将会成长,总流量可能超过5000.我不认为刮掉背景中的许多种子会起作用。
我该怎么做?
答案 0 :(得分:3)
当开放式跟踪器使用http
时,您通常可以在Tracker 'scrape' Convention之后进行全面扫描。
现在,当跟踪器使用UDP
代替时,它不可能再进行完全刮擦。
作为替代方案,一些开放式跟踪器会在其网站上发布完整的摘要:
http://leechers-paradise.org/ - > static_scrape.gz或static_scrape
其他跟踪器可能会或可能不会根据请求访问此类文件。
答案 1 :(得分:3)
可获得以下获取统计数据的策略,按效率降序列出:
/scrape?info_hash=A&info_hash=B&info_hash=C
进行HTTP多次扫描 - 一些跟踪器支持它,有些则不支持。