我的代码进入这个网站并抓取了一个字段。
我想要获取的字段在页面的右侧,( 演讲者姓名)
代码导航到该站点。我获得了xpath,并将其放入代码中。然而输出打印为空白。
如何让它打印演讲者姓名?
\B[A-Z]\B
答案 0 :(得分:0)
数据是通过 JavaScript 从外部源加载的。您可以使用此示例如何通过 requests
模块加载数据:
import json
import requests
url = "https://meetinglibrary.asco.org/record/193286"
api_url = "https://ml-couch.asco.org/records/{id}"
id_ = url.split("/")[-1]
data = requests.get(api_url.format(id=id_)).json()
# uncomment this to print all data:
# print(json.dumps(data, indent=4))
print(data["Role"], data["FullName"])
打印:
Speaker Marcia Cruz-Correa, MD, PhD