我尝试使用下面的代码在此网页(https://www.meleenumerique.com/scientist_comite)上抓取人的名字+姓氏,但是它不起作用。我如何确定出了什么问题?
这是我写的代码
from lxml import html
import csv,os,json
import requests
url="https://www.meleenumerique.com/scientist_comite"
r=requests.get(url)
t=html.fromstring(r.content)
title=t.xpath('/html/head/title/text()')
#Create the list of speaker
speaker=t.xpath('//span[contains(@class,"speaker-name")]//text()')
print(title)
print("Speakers:",speaker)
答案 0 :(得分:1)
您可以尝试使用此Requests-HTML库,该库应可让您从该页面抓取内容。该库支持xpath,并具有处理动态内容的功能。
import requests_html
session = requests_html.HTMLSession()
r = session.get('https://www.meleenumerique.com/scientist_comite')
r.html.render(sleep=5, timeout=8)
for item in r.html.xpath("//*[contains(@class,'speaker-name')]"):
print(item.text)