Python数据抓取:用一系列href和prettify抓取标题不起作用

时间:2018-09-12 05:53:03

标签: python web-scraping

我是Python的新手,我的第一步是从随机站点进行一些Web抓取。这是我的代码,而我对此感到困惑。

我正在抓捕标题和剧集的大小,但是它有2个href,并且整理不起作用。

这是代码:

from bs4 import BeautifulSoup
import requests

source = requests.get('https://1337x.to/popular-tv').text

soup = BeautifulSoup(source, 'lxml')

tvhead = soup.find('tbody')
filename = tvhead.tr.find_all('td',class_='coll-1 name')
print(filename)

现在,我想抓取该剧集的标题和文件大小,然后在该页面中为所有它们循环播放。我很困惑。请帮忙。

但是在此之前,我只能使用以下代码获得标题:

from bs4 import BeautifulSoup
import requests

source = requests.get('https://1337x.to/popular-tv').text
soup = BeautifulSoup(source, 'lxml')
for tvtitle in soup.find_all('td',class_='coll-1 name'):
    a = tvtitle.find_all('a')[1].text
    print (a)
    print()

0 个答案:

没有答案