github repo按语言(和历史数据)计算?

时间:2013-04-14 19:30:14

标签: github github-api

我有兴趣获取某些语言的github repos计数(如果可能的话,还有历史数据。)

以下是我试图自己开始收集统计数据的事情:

  1. 屏幕抓取页面,如:
  2. https://github.com/search?q=language%3Aperl&type=&ref=simplesearch

    1. 使用github API:
    2. https://api.github.com/legacy/repos/search/KEYWORD?language=perl

      但不幸的是,这似乎需要一个KEYWORD来获得任何结果。另外,我只需要计数而不是每个仓库的元数据。

      我也对历史数据感兴趣,似乎这些统计数据可能已在某处可用。

      关于通过语言和/或历史数据获得回购的更好方法的任何想法?

1 个答案:

答案 0 :(得分:4)

你可以试试这个: https://api.github.com/search/repositories?q=language:Python

此外,您可以查询github archive。 使用大查询界面,查询应为:

bq query 'SELECT repository_language, count(repository_language) as pushes
FROM [githubarchive:github.timeline]
WHERE type="CreateEvent" and repository_fork == "false"
GROUP BY repository_language
ORDER BY pushes DESC'

此查询生成每种语言的回购数量统计信息。