我是webscraping的初学者,但我想使用Distil bot检测来抓取网站。有人可以向我推荐一些有助于实现该目标的方法,文章,文章,书。
此站点上的某人提到,在chrome驱动程序中重写某些变量可以解决problem,但是我无法找到pupeteer使用的驱动程序的位置(我正在尝试使用pupeteer)。任何找到chrome驱动程序的帮助都会很好。
其他人说,您可以将distil列入黑名单。有关计算机的哈希(CPU核心,分辨率,用户代理,IP ...)将存储在黑名单中。如果我使用虚拟机,可以绕开它吗?