BigQuery GitHub数据:如何处理回购名称更改?

时间:2017-03-21 18:36:56

标签: github google-bigquery

我的目标是跟踪我的回购邮件的总星数。但是,它的repo.name随着时间的推移而改变。如何使用githubarchive数据集实现此目的?

1 个答案:

答案 0 :(得分:2)

(与https://stackoverflow.com/a/42930963/132438相关)

GitHub项目名称经过更改,因此不是按名称查询,而是通过id查询更安全。您可以在单独的查询中查找项目ID,或者在这样的查询中完全执行:

SELECT 
  COUNT(*) naive_count,
  COUNT(DISTINCT actor.id) unique_by_actor_id, 
  COUNT(DISTINCT actor.login) unique_by_actor_login 
FROM `githubarchive.month.*` 
WHERE repo.id = (
  SELECT repo.id 
  FROM `githubarchive.month.201702` 
  WHERE repo.name='bazelbuild/bazel' 
  LIMIT 1)
AND type = "WatchEvent"