如何从html元素中获取href内容

时间:2017-09-04 16:13:58

标签: python html web-scraping beautifulsoup

/apartamento-en-venta/bogota/nicolas_federman-det-2658430.aspx
/apartamento-en-venta/ibague/multicentro-det-2952281.aspx
/apartamento-en-venta/bogota/bella_suiza-det-2865659.aspx
/apartamento-en-venta/bogota/cedritos-det-2844663.aspx

如何从上面的html元素中获取'aspx'链接。从上面的html内容我需要获取以下值

import re
import requests
from bs4 import BeautifulSoup
page = requests.get(url)
soup = BeautifulSoup(page.content , 'lxml')
index = soup.findAll('div' , 'span-title')
x = []
for i in index:
    x.append(i.find('a'))
print (x)

我使用以下python代码来获取html元素,需要知道如何获取aspx值 url ='https://www.fincaraiz.com.co/finca-raiz/?ad=30|2||||1||||||||||||||||||||||1|||1||||||'

$arr = array ("Orange", "Banana", "Strawberry", "Apple", "Pear");
asort($arr);

我已经在代码上方发布了url以将其输入到python代码

1 个答案:

答案 0 :(得分:0)

找到<a>代码后,您可以使用for i in index: x.append(i.find('a').get('href'))

var chosenProd = document.getElementById(["indProg"+prodNum]);
var chosenProdMore = document.getElementById(["indProdMore0"+prodNum]);