我的目标是跟踪我的回购邮件的总星数。但是,它的repo.name随着时间的推移而改变。如何使用githubarchive
数据集实现此目的?
答案 0 :(得分:2)
(与https://stackoverflow.com/a/42930963/132438相关)
GitHub项目名称经过更改,因此不是按名称查询,而是通过id查询更安全。您可以在单独的查询中查找项目ID,或者在这样的查询中完全执行:
SELECT
COUNT(*) naive_count,
COUNT(DISTINCT actor.id) unique_by_actor_id,
COUNT(DISTINCT actor.login) unique_by_actor_login
FROM `githubarchive.month.*`
WHERE repo.id = (
SELECT repo.id
FROM `githubarchive.month.201702`
WHERE repo.name='bazelbuild/bazel'
LIMIT 1)
AND type = "WatchEvent"