我正在查看带有以下标题的网络文件。如何使用bs4获取google.com页面的内容?
<head>
<meta http-equiv="refresh" content="5;url=http://google.com"/>
</head>
谢谢!
答案 0 :(得分:3)
使用标记名为find
的{{1}},并且具有已知固定属性的meta
,attrs
需要具有http-equiv
的值。从结果集中获取第一个这样的元素,并获取其refresh
属性的值,然后将其解析为url。
因此你得到:
'content'