我正在尝试抓取页面,为此,我想与Tor浏览器连接,请使用py脚本将其打开并抓取所需的内容。我的问题是,打开Tor浏览器后无法访问我的页面-应用显示“无法连接”警报,但出现错误:
消息:已到达错误页面
更糟糕的是,我没有管理员的权限,因此解决此问题的方法很少。我已经尝试了很多单独使用驱动程序和tor的警告,例如更改geckodriver的版本,使用带有“ profile.default”的路径或更改torc文件。
def open_tor_browser():
profile = webdriver.FirefoxProfile()
binary = FirefoxBinary(r'C:\Users\user\Desktop\Tor Browser\Browser\firefox.exe')
gecodriverPath = 'D:\\BrowsersDriver\\geckodriver.exe'
profile.set_preference('network.proxy.type', 1)
profile.set_preference('network.proxy.socks', '127.0.0.1')
profile.set_preference('network.proxy.socks_port', 9151)
browser = webdriver.Firefox(firefox_profile=profile,firefox_binary=binary,executable_path=gecodriverPath)
browser.get("http://yahoo.com")
print()
直到现在,我一直只使用普通的Firefox和chrome进行抓取,没有那么多麻烦。也许我应该改变解决这个问题的方式,或者个人资料偏好设置不正确。 我将不胜感激