如何逐步抓取github信息并处理信息?

时间:2014-12-30 01:10:45

标签: java github-for-windows

我正在使用java和GitHub API来抓取Windows 7中的GitHub信息。

  1. 我想知道如何知道项目的信息是否已更新。例如,当一个新的贡献者加入项目时,GitHub可以通知我吗?或者我应该不时地抓取这些信息(比如每个X)小时爬行)。

  2. 你能否给我一些关于处理这些数据的建议?我的意思是当项目的源代码更新时(提交更改了原始代码),我应该删除原始代码并将新的代码复制到我的计算机并添加有关此操作的条目?

1 个答案:

答案 0 :(得分:3)

您可以使用GitHub API Webhooks获取有关事件的通知。例如。如果您想在新贡献者加入项目时收到通知,您需要为以下事件设置Webhook:

  

team_add每次在存储库中添加或修改团队时。

还有一个匹配所有事件的通配符事件(*)。有关如何设置和使用Webhooks的详细教程,请访问GitHub

在处理数据方面,我想这取决于你对源代码的处理方式。例如,如果您要使用一些静态分析工具扫描代码以查找错误,那么您可以保留新版本的代码。否则,如果您要对整个提交历史记录进行一些分析,那么您可以跟踪所有修改和更改。