从一组Github提交中检索提交消息和哈希值

时间:2018-11-17 10:06:40

标签: git github

我有一个数据库,其中包含一些项目的GitHub提交(或哈希)的链接。我想对提交评论(消息)进行情感分析。我需要打印一个给定的提交但来自大量项目的提交消息。

但是,如何在不克隆所有项目并分别从特定提交中检索信息的情况下做到这一点?

1 个答案:

答案 0 :(得分:1)

您可以使用official GitHub REST API v3,特别是commits endpoint of the Git database API并将提交作为JSON对象检索。语法如下:

GET /repos/:owner/:repo/git/commits/:commit_sha

用正确的值替换:owner:repo:commit_sha。 例如:

GET https://api.github.com/repos/torvalds/linux/git/commits/8dc765d438f1e42b3e8227b3b09fad7d73f4ec9a

是此提交的JSON表示形式: https://github.com/torvalds/linux/commit/8dc765d438f1e42b3e8227b3b09fad7d73f4ec9a

,其中包含包含提交消息的字段消息。