blogger / blogspot(guestAuth):如何获取覆盖警告页面代码

时间:2017-06-08 05:30:46

标签: python bash blogger blogspot

使用浏览器并连接到某个blogger / blogspot网站,您可以收到内容警告。 像这个: http://ferdinandkreozot.blogspot.com/2015/12/busy-as.html("原始页面") 此内容警告页面覆盖内容页面并显示警告确认按钮。 acknoledgement按钮代码是: http://ferdinandkreozot.blogspot.com/2015/12/busy-as.html?guestAuth='一些非常长的ID' ("警告内容页面") "一些非常长的ID"每次生成。也许这会使用cookies? 这适用于浏览器。

但是我使用带有bash和python脚本的无头linux。 我需要显示内容页面的html代码。 但我首先要承认这个警告。 所以我想知道我是否访问了#34;警告内容页面"首先,我应该能够访问内容页面。

但是从我写的代码中我无法显示警告页面代码。我有一些内容页面的摘录。 我无法获取该警告页面代码(尝试使用python和wget)。

这是我的python脚本:

import os, sys, urllib, httplib2, validators, time

from bs4 import BeautifulSoup, SoupStrainer

http = httplib2.Http()

status, response = http.request(url)

for link in BeautifulSoup(response, 'html.parser', parse_only=SoupStrainer('img')):
    print link['src']

是否有一种方法可以从脚本(python,bash ...)中检索"警告内容页面的链接" ?

感谢您的帮助

0 个答案:

没有答案