我必须抓取几个网站来获取一些数据。我在C#中使用Selenium ChromeDriver。我以这种方式初始化了ChromeDriver:
var options = new ChromeOptions();
options.AddArguments("headless");
options.AddArgument("--log-level=3");
options.AddArgument("--no-sandbox");
options.AddArgument("--silent");
options.AddArgument("--user-agent=Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36");
string pathChromeDriver = Directory.GetCurrentDirectory();
driver = new ChromeDriver(pathChromeDriver,options,TimeSpan.FromMinutes(3));
问题是,如果我使用driver.Navigate().GoToUrl(url);
导航到页面的url,驱动程序不会转到我必须从中读取数据的页面,但是在结果页面中会有一个“我不是机器人”验证码。如果我从浏览器手动打开页面,它将正常打开页面。
有没有办法刮掉以人类用户身份出现的页面?谢谢