Question

我是Python的新手，我的第一步是从随机站点进行一些Web抓取。这是我的代码，而我对此感到困惑。

我正在抓捕标题和剧集的大小，但是它有2个href，并且整理不起作用。

这是代码：

from bs4 import BeautifulSoup
import requests

source = requests.get('https://1337x.to/popular-tv').text

soup = BeautifulSoup(source, 'lxml')

tvhead = soup.find('tbody')
filename = tvhead.tr.find_all('td',class_='coll-1 name')
print(filename)

现在，我想抓取该剧集的标题和文件大小，然后在该页面中为所有它们循环播放。我很困惑。请帮忙。

但是在此之前，我只能使用以下代码获得标题：

from bs4 import BeautifulSoup
import requests

source = requests.get('https://1337x.to/popular-tv').text
soup = BeautifulSoup(source, 'lxml')
for tvtitle in soup.find_all('td',class_='coll-1 name'):
    a = tvtitle.find_all('a')[1].text
    print (a)
    print()

Python数据抓取：用一系列href和prettify抓取标题不起作用

0 个答案: