从Spotify获取大量元数据

时间:2014-11-20 13:49:59

标签: python web-scraping spotify

我正在开展一个项目,我必须尽可能多地从Spotify获取元数据。我使用以下网址获取数据: url =' http://api.spotify.com/v1/searchquery=' + letter +'& type = track,album,artist& offset =' + str(pageNo)+'&限制= 50'

在哪里'字母'是我想要数据的曲目/艺术家/专辑的起始字母,以及' pageNo'是偏移量的索引。当我进行这样的调用时,将数据转换为json格式为' searchResponse'在python中,我可以使用: searchResponse ['轨道'] ['总'] 获取与我的搜索条件匹配的曲目总数。如果我只是搜索字母' a',我得到的音轨总数应该是3223366.但是,当我遍历我的结果时,我只能获得100000首曲目的数据。在那之后我只得到空的结果。因此,当我使用100000的偏移量进行我的url调用时,我从50个新轨道获取数据,但是一旦我将偏移量增加到100000以上,我就得到一个空的结果。其他字母也一样。

那么,如何从比第一个100000更多的曲目中获取元数据?

1 个答案:

答案 0 :(得分:0)

虽然我同意您应该能够提供大于100000的偏移量并且这是我们可能需要研究的技术问题,但我认为必须翻阅超过1000000个项目才能明确指出搜索查询可以改进。

这里最重要的是Jan-Philip Gehrcke已经提到过 - 你最有可能违反Spotify's Terms of Use