在Windows上使用带有Python Selenium的Tor进行“已到达错误页面”网页抓取

时间:2019-02-04 15:35:30

标签: python selenium firefox webdriver tor

我正在尝试抓取页面,为此,我想与Tor浏览器连接,请使用py脚本将其打开并抓取所需的内容。我的问题是,打开Tor浏览器后无法访问我的页面-应用显示“无法连接”警报,但出现错误:

消息:已到达错误页面

更糟糕的是,我没有管理员的权限,因此解决此问题的方法很少。我已经尝试了很多单独使用驱动程序和tor的警告,例如更改geckodriver的版本,使用带有“ profile.default”的路径或更改torc文件。

def open_tor_browser():
    profile = webdriver.FirefoxProfile()
    binary = FirefoxBinary(r'C:\Users\user\Desktop\Tor Browser\Browser\firefox.exe')
    gecodriverPath = 'D:\\BrowsersDriver\\geckodriver.exe'
    profile.set_preference('network.proxy.type', 1)
    profile.set_preference('network.proxy.socks', '127.0.0.1')
    profile.set_preference('network.proxy.socks_port', 9151)
    browser = webdriver.Firefox(firefox_profile=profile,firefox_binary=binary,executable_path=gecodriverPath)
    browser.get("http://yahoo.com")
    print()

直到现在,我一直只使用普通的Firefox和chrome进行抓取,没有那么多麻烦。也许我应该改变解决这个问题的方式,或者个人资料偏好设置不正确。 我将不胜感激

0 个答案:

没有答案