我是Python的新手,我的第一步是从随机站点进行一些Web抓取。这是我的代码,而我对此感到困惑。
我正在抓捕标题和剧集的大小,但是它有2个href
,并且整理不起作用。
这是代码:
from bs4 import BeautifulSoup
import requests
source = requests.get('https://1337x.to/popular-tv').text
soup = BeautifulSoup(source, 'lxml')
tvhead = soup.find('tbody')
filename = tvhead.tr.find_all('td',class_='coll-1 name')
print(filename)
现在,我想抓取该剧集的标题和文件大小,然后在该页面中为所有它们循环播放。我很困惑。请帮忙。
但是在此之前,我只能使用以下代码获得标题:
from bs4 import BeautifulSoup
import requests
source = requests.get('https://1337x.to/popular-tv').text
soup = BeautifulSoup(source, 'lxml')
for tvtitle in soup.find_all('td',class_='coll-1 name'):
a = tvtitle.find_all('a')[1].text
print (a)
print()