C#Selenium WebDriver抓取网站而不受验证码阻止

时间:2018-07-20 07:26:20

标签: c# .net selenium selenium-webdriver

我必须抓取几个网站来获取一些数据。我在C#中使用Selenium ChromeDriver。我以这种方式初始化了ChromeDriver:

var options = new ChromeOptions();
options.AddArguments("headless");
options.AddArgument("--log-level=3");
options.AddArgument("--no-sandbox");
options.AddArgument("--silent");
options.AddArgument("--user-agent=Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36");
string pathChromeDriver = Directory.GetCurrentDirectory(); 
driver = new ChromeDriver(pathChromeDriver,options,TimeSpan.FromMinutes(3));

问题是,如果我使用driver.Navigate().GoToUrl(url);导航到页面的url,驱动程序不会转到我必须从中读取数据的页面,但是在结果页面中会有一个“我不是机器人”验证码。如果我从浏览器手动打开页面,它将正常打开页面。 有没有办法刮掉以人类用户身份出现的页面?谢谢

0 个答案:

没有答案