Java:从网站表中提取数据

时间:2018-03-03 01:00:44

标签: java html web extract data-extraction

我正试图浏览纽约证券交易所网站的数据。有一个表(虽然它的格式不像HTML表格,而是div里面div的内部div),我想要分析数据点。所以我有以下方法来实际加载并开始解析html:

public static void skim() throws IOException {

    URL url = new URL("https://www.nyse.com/quote/XNYS:JNJ");
    java.io.InputStream is = url.openConnection().getInputStream();
    int ptr = 0;
    StringBuffer buffer = new StringBuffer();

    while ((ptr = is.read()) != -1) {
        System.out.print((char)ptr);
        buffer.append((char)ptr);
    }

}

它运行良好,但问题是它打印出来的HTML与我检查元素时看到的HTML略有不同。实际数据本身似乎缺失了。所以我猜它与框架HTML分开加载。那么我如何从网站上获得数据点呢?是否有某种方式我应该加载网页或什么?

0 个答案:

没有答案