我正在开发一个应用程序,该应用程序遍历一系列github存储库并确定哪些github用户(存储在单独的表中)没有给每个存储库加注星标。
等效的卷曲请求如下所示。
curl https://api.github.com/repos/<GITHUB_REPOSITORY>/stargazers?access_token=<ACCESS_TOKEN>
以上将每页返回30位已对该存储库加注星标的github用户,我们可以将其增加到每页最多100个,如下所示:
curl https://api.github.com/repos/<GITHUB_REPOSITORY>/stargazers?access_token=<ACCESS_TOKEN>/?page=<PAGE_NUMBER>&per_page=100
例如,如果一个仓库有540个星星,我将进行6次迭代以获取已加星标的github用户名列表。对于星数较少(例如少于5000个)的存储库,这一切正常。但是,随着恒星数量的增加,我担心它可能会遇到诸如节流的网络问题。我用一个有100,000多颗星星的仓库运行该程序(即使我的需求相对较少),但它返回了此错误。
ERROR - Remote host closed the connection before initiating inbound response"
有人可以告诉我在不运行网络的情况下获取github用户名列表的最佳方法是什么。