我试图从1995年到2015年废弃Billboards 100强的数据。以下是URL的示例链接:
http://www.umdmusic.com/default.asp?Lang=English&Chart=E&ChDay=20&ChMonth=12&ChYear=2014&ChBand=&ChSong=E
我使用bs4和urllib将页面转换为txt,然后使用find_all()
提取标签。我可以使用以下代码提取相册:table_data = bsObj.findAll('b')
但是,当我尝试提取统计信息时,我不确定如何提取,因为<td>
标记没有属性:
任何人都可以解释如何提取没有umdmusic网站属性的统计数据?