我正在尝试从网站抓取特定信息,但它不知何故对我不起作用。
import requests
from bs4 import BeautifulSoup
import csv
user_agent = {'User-agent': 'Chrome/43.0.2357.124'}
output_file= open("Getyourguide.csv", "w", newline='')
r = requests.get("http://www.getyourguide.de/s/?q=seoul")
soup = BeautifulSoup(r.content)
g_data = soup.find_all("header", {"class": "activity-card-header"})
print(g_data)
只打印这么多: []
因此,我深入研究了html源代码,并注意到我想收集的信息最有可能来自Iframe:
<!DOCTYPE html>
<html>
<body>
<div style="display:inline;">
<img alt="" height="1" src="//www.googleadservices.com/pagead/conversion/966398101/?label=ZXUsCLOE-gQQlaHozAM&url=&guid=ON&script=0&data=" style="border-style:none;" width="1"/>
<noscript><iframe src="//www.googletagmanager.com/ns.html?id=GTM-3XTJ" height="0" width="0" style="display:none;visibility:hidden"></iframe></noscript>
我从来没有抓过过iframe。因此,我不确定我的方法应该是什么样的,以便从网站上获取描述,价格等信息。有人能给我一个暗示吗?任何反馈都表示赞赏。