我知道如何获取一个Github存储库的数据并创建一个DataFrame。但是我不确定如何缩放它,以便DataFrame将包含多个列,每个列代表一个不同的回购提交。
我当时在考虑使用for循环,但不确定在这种情况下如何进行。
crypto = ['ethereum', 'bitcoin']
project = ['go-ethereum', 'bitcoin']
with urllib.request.urlopen("https://api.github.com/repos/" + crypto + "/"
+ project + "/stats/commit_activity") as url:
jStr = url.read()
data = json.loads(jStr)
data = (json_normalize(data, 'days','week').set_index('week').rename(columns={0:crypto}))
data.index = (pd.to_datetime(data_activity.index, unit='s') + pd.to_timedelta(np.arange(len(data_activity.index)) % 7, unit='d')
我的目标是可以在加密列表中输入GitHub帐户,并在项目变量中输入存储库。运行这两个列表并创建一个数据框
ethereum bitcoin
2017-11-26 2 4
2017-11-27 3 4