Python - webscrapping

时间:2018-05-14 08:21:05

标签: python html web-scraping

我试图在Anaconda提示符下通过Python进行网页抓取。以下是详细信息。

网页抓图链接:

https://sa.aqar.fm/%D9%81%D9%84%D9%84-%D9%84%D9%84%D8%A8%D9%8A%D8%B9/1

我正在尝试使用以下代码从以上代码中找到带有以下代码的标题,但不知何故,这给了我一个问题。

脚本:容器中的容器:

title_container = container.findAll("div",{"class":"title"})

title_name = title_container[0].text

错误

  

文件Webscrap.py,第75行,

     

title_name = title_container [0] .text

     

IndexError:列表索引超出范围

我附上了我应该提取的上述链接的标题图片。

enter image description here

1 个答案:

答案 0 :(得分:0)

由于语言对我来说是一个严重的障碍,我仍然不确定我实际解析了什么。但是,这应该可以帮助你。

import requests
from bs4 import BeautifulSoup

URL = 'https://sa.aqar.fm/%D9%81%D9%84%D9%84-%D9%84%D9%84%D8%A8%D9%8A%D8%B9/1'

res = requests.get(URL)
soup = BeautifulSoup(res.text, 'lxml')
for items in soup.select(".content [id^='single-id-']"):
    title = items.select_one("h4 a").text
    price = items.select_one(".price").text
    print(title,price)