Question

我正在尝试使用Serritor抓取动态网页，但是存在一个问题：

这是我的代码：

 public class MyCrawler extends BaseCrawler {

    public MyCrawler() {
        String pathToDriver = ".//ChromeDriver//chromedriver.exe";
        System.setProperty("webdriver.chrome.driver", pathToDriver);
        config.setWebDriver(new ChromeDriver());
        config.setFilterOffsiteRequests(true);
        config.addSeedAsString("http://yourspecificsite.com");
        config.setCrawlingStrategy(CrawlingStrategy.DEPTH_FIRST);
        config.setDelayBetweenRequests(Duration.ofSeconds(1));

    }

}

这就是回报：

Exception in thread "main" java.lang.NoClassDefFoundError: org/openqa/selenium/htmlunit/HtmlUnitDriver
at com.github.peterbencze.serritor.internal.CrawlerConfiguration.<init>(CrawlerConfiguration.java:47)
at com.github.peterbencze.serritor.api.BaseCrawler.<init>(BaseCrawler.java:68)
at serritor_versuch2.MyCrawler.<init>(MyCrawler.java:21)
at serritor_versuch2.run.main(run.java:5)
Caused by: java.lang.ClassNotFoundException: org.openqa.selenium.htmlunit.HtmlUnitDriver
at java.net.URLClassLoader.findClass(Unknown Source)
at java.lang.ClassLoader.loadClass(Unknown Source)
at sun.misc.Launcher$AppClassLoader.loadClass(Unknown Source)
at java.lang.ClassLoader.loadClass(Unknown Source)
... 4 more

Answer 1

base

以上异常明确指出未找到HtmlUnitDriver类。如果您使用的是maven，则应该在for文件中添加maven依赖项。

不确定，您使用的是哪个版本，但这是最新版本。

Exception in thread "main" java.lang.NoClassDefFoundError: org/openqa/selenium/htmlunit/HtmlUnitDriver

如果您使用的是gradle或任何其他依赖关系管理工具，请查看以下内容：Maven Repository

如果您没有使用任何依赖项管理工具，则应下载jar文件并将其放在类路径中。

领土问题

1 个答案: