Question

嗨，我想从这段代码中获取价格

import re
import requests
from bs4 import BeautifulSoup
list3 = []
r = requests.get('https://bama.ir/car/peugeot/')
soup = BeautifulSoup(r.text, 'html.parser')
res2 = soup.find_all('div', attrs={'class':'listdata'})
for item in res2:
    z = re.findall(r'<span itemprop="price" content="([^"]*)">[^<]*</span>',str(item))
    list3 += z

for item in list3:
    print(item)

但是此代码未返回“ 0”价格。我也希望“ 0”价格。有人可以帮我吗？

Answer 1

我想，您希望返回0属性中的content，这可能很接近：

import re
import requests
from bs4 import BeautifulSoup
list3 = []
r = requests.get('https://bama.ir/car/peugeot/')
soup = BeautifulSoup(r.text, 'html.parser')
res2 = soup.find_all('div', attrs={'class': 'listdata'})
# print(res2)
for item in res2:
    z = re.findall(r'content="(\d*)"', str(item))
    list3 += z

for item in list3:
    print(item)

输出

如果您希望简化/修改/探索表达式，请在regex101.com的右上角进行说明。如果愿意，您还可以在this link中查看它如何与某些示例输入匹配。

Answer 2

我最终使用此代码获取零数字

import re
import requests
from bs4 import BeautifulSoup
list3 = []
r = requests.get('https://bama.ir/car/peugeot/')
soup = BeautifulSoup(r.text, 'html.parser')
res2 = soup.find_all('div', attrs={'class': 'overview'})
for item in res2:
    z1 = re.findall(r'content="([0-9])"',str(item))
    list3 += z1
    z2 = re.findall(r'<!-- <p class="cost"><span itemprop="price" content="(\d*)">',str(item))
    list3 += z2
for item in list3:
    print(item)

感谢您的帮助。

网站的网站报废价格为零的问题

2 个答案:

输出