如何确定哪些元素用作cssQuery

时间:2019-06-20 03:55:21

标签: java maven web-scraping

我真的很想了解如何从网站上实际提取想要的数据。我已经从YouTube上的教程中获得的IMDb顶部图表完成了此操作,但这使我不知道如何为row.select参数插入哪种语法。

我曾尝试与Best Buy等其他网站合作,获取特定笔记本电脑的价格和名称,但我失败了,因为我敢肯定我输入了错误的参数(cssQuery)。

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

import javax.swing.*;
import java.io.IOException;


public class Scraper {
static  String title;
static final String url  = "https://www.imdb.com/chart/top";
public static void main(String args[])throws IOException {

    final Document document = Jsoup.connect(url).get();

    for(Element row: document.select("table.chart.full-width tr")){
            final String title = row.select(".titleColumn a").text();
            final String rating = row.select(".imdbRating").text();
            System.out.println(title);
            System.out.println(rating);
   }
}

}

1 个答案:

答案 0 :(得分:0)

对于我从我们的问题中得到的理解是,您不知道在您的代码中放置了哪个CSS类。为此,您可以通过右键单击网站并单击检查元素来检查网站,然后从那里您可以通过按ctrl + shift + c来检查div类,并将鼠标悬停在网站上的任何元素上,如下图所示