Question

我使用Github API V3来获取存储库的分数，我使用：

GET /repos/:owner/:repo/forks

即使存储库包含更多内容，该请求也只给我带来了30个结果，我用Google搜索了一点，我发现由于内存限制，API每页只返回30个结果，如果我想要下一个结果，我必须指定页数。

只有我，我不需要所有这些信息，我需要的只是叉子的数量有没有办法只获得分叉数？

因为如果我每页开始循环页面，如果存储库包含数千个结果，我的脚本会崩溃。

Answer 1

我有一份工作，需要将所有叉子作为git项目的git-remotes 。

我写了简单的python脚本https://gist.github.com/urpylka/9a404991b28aeff006a34fb64da12de4

程序的基础是递归函数，用于获取叉子。而且我遇到了同样的问题（ GitHub API仅向我退还30个项目）。

我通过添加?page=1来解决它，并添加了对来自服务器的空响应的检查。

def get_fork(username, repo, forks, auth=None):

page = 1
while 1:

    r = None
    request = "https://api.github.com/repos/{}/{}/forks?page={}".format(username, repo, page)
    if auth is None: r = requests.get(request)
    else: r = requests.get(request, auth=(auth['login'], auth['secret']))
    j = r.json()
    r.close()

    if 'message' in j:
        print("username: {}, repo: {}".format(username, repo))
        print(j['message'] + " " + j['documentation_url'])
        if str(j['message']) == "Not Found": break
        else: exit(1)

    if len(j) == 0: break
    else: page += 1

    for item in j:
        forks.append({'user': item['owner']['login'], 'repo': item['name']})

        if auth is None:
            get_fork(item['owner']['login'], item['name'], forks)
        else:
            get_fork(item['owner']['login'], item['name'], forks, auth)

Answer 2

您可以尝试使用搜索查询。

例如，对于我的回购VonC/b2d，我会使用：

https://api.github.com/search/repositories?q=user%3AVonC+repo%3Ab2d+b2d

json答案给了我一个"forks_count": 5

这是一个有超过4000个分叉的分支（仅考虑第一个结果，即“full_name”实际上是“strongloop/express”的那个结果。

https://api.github.com/search/repositories?q=user%3Astrongloop+repo%3Aexpress+express

"forks_count": 4114,

如何使用GitHub API获取GitHub存储库的分叉数量？

2 个答案: