在下面的代码中,我创建了一个试图从中获取src的函数 html5中的视频标签使用bs4,但它似乎无法正常工作
import urllib
from bs4 import BeautifulSoup
def spider(start_at, end):
i = 39841
while (i + start_at) <= (end + i):
url = "http://wwww.getvids.org/watch/" + str(i + start_at)
meet = requests.get(url).text
bso4 = BeautifulSoup(meet, "html.parser")
for vidL in bso4.findAll("video", {'class': 'vjs-tech'}):
print vidL.get("src")
print 'done'
start_at += 1
对于记录我看到了这个“How to find specific video html tag using beautiful soup?”,但我无法让它工作
答案 0 :(得分:0)
试试这个(“ find_all ”而不是“ findAll ”):
for vidL in bso4.find_all("video", {'class': 'vjs-tech'}):
错误分类BS4的“find_all”是此库中最常见的错误之一。