我一直在练习使用python进行网页抓取,并试图从网站上下载视频。
url = 'http://www.toonova.net/we-bare-bears-episode-0'
res = requests.get(url, stream = True)
res.raise_for_status()
soup = bs4.BeautifulSoup(res.text, 'lxml')
video = str(soup.select('iframe')[1])
video = video.split('"')
src = video[3]
res = requests.get(src)
res.raise_for_status()
video_file = open(os.path.join('We Bare Bears', os.path.basename(src)), 'wb')
for chunk in res.iter_content(1024):
video_file.write(chunk)
video_file.close()
此代码创建具有相应扩展名的MP4文件,但该文件似乎已损坏。我对此仍然缺乏经验,并会对我做错的任何提示表示感谢。