在活动网站中检索外部torrent统计信息的最佳方法

时间:2015-07-05 08:39:11

标签: php bittorrent tracker torrent

我制作了类似于The Pirate Bay,Kickass.to等的bittorrent跟踪器/网站。在索引和torrent页面中检索torrent统计信息(浏览器,下载)是必要的。例如:

http://kat.cr/ubuntu-15-04-vivid-vervet-desktop-amd64-iso-final-t10550003.html
播种机:3442 Leechers:148

如果torrent正在使用我的智能设备,则很容易快速检索这两个网页的数据。但是,如果torrent使用不同的跟踪器,我需要从所述跟踪器中获取其统计信息(向其发出请求),但每个torrent通常需要几秒钟,显然,我无法让用户等待那么久才能看到上市。

我制作了一个脚本,用来刮掉最近在背景中运行的90个种子,但我担心它还不够。该网站将会成长,总流量可能超过5000.我不认为刮掉背景中的许多种子会起作用。

我该怎么做?

2 个答案:

答案 0 :(得分:3)

当开放式跟踪器使用http时,您通常可以在Tracker 'scrape' Convention之后进行全面扫描。
现在,当跟踪器使用UDP代替时,它不可能再进行完全刮擦。

作为替代方案,一些开放式跟踪器会在其网站上发布完整的摘要:

其他跟踪器可能会或可能不会根据请求访问此类文件。

答案 1 :(得分:3)

可获得以下获取统计数据的策略,按效率降序列出:

  1. 通过刮擦接口进行完全刮擦 - 过去很常见,由于流量导致大型跟踪器现在不太常见
  2. 通过自定义导出网址完全抓取 - 您必须询问跟踪器管理员。有时会在他们的网站上记录
  3. UDP multi-scrape
  4. 通过/scrape?info_hash=A&info_hash=B&info_hash=C进行HTTP多次扫描 - 一些跟踪器支持它,有些则不支持。
  5. http single-scrape
  6. DHT scrape
  7. 加入群组并通过PEX
  8. 进行衡量