使用浏览器并连接到某个blogger / blogspot网站,您可以收到内容警告。 像这个: http://ferdinandkreozot.blogspot.com/2015/12/busy-as.html("原始页面") 此内容警告页面覆盖内容页面并显示警告确认按钮。 acknoledgement按钮代码是: http://ferdinandkreozot.blogspot.com/2015/12/busy-as.html?guestAuth='一些非常长的ID' ("警告内容页面") "一些非常长的ID"每次生成。也许这会使用cookies? 这适用于浏览器。
但是我使用带有bash和python脚本的无头linux。 我需要显示内容页面的html代码。 但我首先要承认这个警告。 所以我想知道我是否访问了#34;警告内容页面"首先,我应该能够访问内容页面。
但是从我写的代码中我无法显示警告页面代码。我有一些内容页面的摘录。 我无法获取该警告页面代码(尝试使用python和wget)。
这是我的python脚本:
import os, sys, urllib, httplib2, validators, time
from bs4 import BeautifulSoup, SoupStrainer
http = httplib2.Http()
status, response = http.request(url)
for link in BeautifulSoup(response, 'html.parser', parse_only=SoupStrainer('img')):
print link['src']
是否有一种方法可以从脚本(python,bash ...)中检索"警告内容页面的链接" ?
感谢您的帮助