如何获取用户的所有公共github提交

时间:2012-05-14 21:01:52

标签: github github-api

无论项目如何,我都想知道是否有一种简单的方法可以将所有公共存储库的所有提交用于一个用户名。

由于我属于多个组织,我正在尝试编译我是其贡献者的项目列表,以及我已接受拉取请求的项目。

到目前为止,我的google-fu并且通过github api文档查看证明是不够的。

6 个答案:

答案 0 :(得分:20)

http://zmoazeni.github.com/gitspective/是你的朋友。 :-)过滤掉除了" Push"之外的所有内容,你有了自己的观点,尽管没有编码工作可以先实现它。

检查Chrome Devtools" Network"如果您想自己重做工作,选项卡可能会帮助您模拟API查询。

答案 1 :(得分:11)

正确的方法是通过Events API

首先你需要fetch the user's events

GET /users/:username/events

然后,您需要过滤项where type is set to PushEvent的响应数组。这些项中的每一项对应于用户的git push。来自该推送的提交在payload.commits数组中以反向时间顺序提供。

下一步是通过检查每个提交对象的author.email属性来过滤掉其他用户提交的提交。您还可以访问同一对象上的shamessageurl等属性,并且可以使用distinct属性消除多次推送中的重复提交。

编辑:正如Adam Taylor在评论中指出的那样,这种做法是错误的。我没能通过RTFM,抱歉。 API允许您获取最多300个事件,事件也仅限于过去90天。为了完整起见,我将在这里留下答案,但是对于提取所有提交的陈述问题,它不会起作用。

答案 2 :(得分:4)

更新2018-11-12

下面提到的网址现已转移到一个类似https://github.com/AurelienLourot?from=2018-10-09的网址,但这个想法保持不变。请参阅github-contribs

  

我想知道是否有一种简单的方法可以为一个用户名获取所有公共存储库的所有提交。

第一个挑战是列出用户曾贡献的所有回购。正如其他人所指出的那样,官方API不允许您从一开始就获取此信息

仍然可以通过查询非官方页面并在循环中解析它们来获取该信息:

(免责声明:我是维护者。)

这正是github-contribs为您所做的事情:

$ sudo npm install -g @ghuser/github-contribs
$ github-contribs AurelienLourot
✔ Fetched first day at GitHub: 2015-04-04.
⚠ Be patient. The whole process might take up to an hour... Consider using --since and/or --until
✔ Fetched all commits and PRs.
35 repo(s) found:
AurelienLourot/lsankidb
reframejs/reframe
dracula/gitk
...

答案 3 :(得分:1)

我知道这个问题很老了,但我最终编写了自己的解决方案。

最后解决方案是找到用户使用organization_repositorieslist_repositories服务贡献的所有潜在存储库(我正在使用octokit)。

然后我们在这些存储库中找到所有活动分支(service branches),并且每个分支都只查找来自我们用户的提交(service commits)。

示例代码有点广泛,但可以找到here

OBS: As pointed out, this solution does not consider organizations and repositories where you contributed but are not part of.

答案 4 :(得分:0)

您可以使用API​​方法获取有关用户的信息:get-a-single-user

之后,您可以找到所有用户存储库,然后使用以下功能进行提交:

def get_github_email(user_login, user_name, key):
    '''
    :param str user_login: user login for GitHub
    :param str key: your client_id + client_secret from GitHub, 
                string like '&client_id=your_id&client_secret=yoursecret'
    :param str user_name: user GitHub name (could be not equeal to user_login)
    :return: email (str or None) or False
    '''
    url = "https://api.github.com/users/{}/repos?{}".format(user_login, key)
    #get repositories
    reps_req = requests.get(url)

    for i in reps_req.json():
        if "fork" in i:
            # take only repositories created by user not forks
            if i["fork"] == False:
                commits_url = "https://api.github.com/repos/{}/{}/commits?{}".format(user_login, i["name"], key)
                #get commits
                commits_req = requests.get(commits_url)

                for j in commits_req.json():
                    #check if author is user (there may be commits from someone else)
                    if j.get("commit", {}).get("author", {}).get("name") == user_name:
                        return j["commit"]["author"]["email"]
    return False

答案 5 :(得分:0)

GitGub GraphQL API v4 ContributionsCollection对象在两个日期之间提供按存储库分组的贡献,最多100个存储库。 fromto最多可以相隔一年,因此要检索所有捐款,您将需要进行多次请求。

query ContributionsView($username: String!, $from: DateTime!, $to: DateTime!) {
  user(login: $username) {
    contributionsCollection(from: $from, to: $to) {
      commitContributionsByRepository(maxRepositories: 100) {
        repository {
          nameWithOwner
        }
        contributions {
          totalCount
        }
      }
      pullRequestContributionsByRepository(maxRepositories: 100) {
        repository {
          nameWithOwner
        }
        contributions {
          totalCount
        }
      }
    }
  }
}