硒未显示实际的html页面

时间:2020-07-20 06:14:25

标签: java selenium jsoup

所以我一起使用selenium和jsoup来获取动态网站的HTML页面。因此,我面临的问题是,我使用硒获取的页面源仍未由网站更新。所以我在Flipkart上搜索。

public class Main {

    public static void main(String[] args) {
        Scanner sc  = new Scanner(System.in);
        String searchtext = sc.nextLine();
        System.setProperty("webdriver.chrome.driver", "C:\\Users\\test\\chromedriver.exe");
        WebDriver driver = new ChromeDriver();
        try{
            driver.get("https://www.flipkart.com/search?q=" + searchtext+ "&otracker=search&otracker1=search&marketplace=FLIPKART&as-show=on&as=off");
            String content  = driver.getPageSource();
            Document doc = Jsoup.parse(content);
            Elements link = doc.getElementsByClass("_3BTv9X");
            System.out.println(link);
        }catch (Exception e){
            System.out.println("Error " + e);
        } finally {
            driver.quit();
        }
    }
}

这是我使用驱动程序的方式。所以我想要产品的图像链接。我使用的类是图像类。因此,例如,如果我搜索口罩,这就是我要得到的,

<div class="_3BTv9X" style="height:280px;width:200px">
 <img class="_1Nyybr _30XEf0" alt="Van Heusen VHMSBRGPH53287" src="https://rukminim1.flixcart.com/image/612/612/k9u8zgw0/mask-respirator/2/k/j/vhmsbrgph53287-van-heusen-original-imafrjnfytwdxfka.jpeg?q=70">
</div>
<div class="_3BTv9X" style="height:280px;width:200px">
 <img class="_1Nyybr" alt="NHR Surgical Face Mask, Anti Pollution, 3 Ply Face Mask with ISO 9001:2015 Certification (Pack of 30) SG-30 Surgical Mask" src="//img1a.flixcart.com/www/linchpin/fk-cp-zion/img/placeholder_9951d0.svg">
</div>

对于上述产品,我将获得图像的完整链接,在其下方,它是Flipkart的基本标志。

注意:这只是输出的一小部分。输出实际上包含50多种产品。我只想显示一些链接有效,而有些则无效。

请帮助我。我现在该怎么办?

0 个答案:

没有答案