我正试图浏览纽约证券交易所网站的数据。有一个表(虽然它的格式不像HTML表格,而是div里面div的内部div),我想要分析数据点。所以我有以下方法来实际加载并开始解析html:
public static void skim() throws IOException {
URL url = new URL("https://www.nyse.com/quote/XNYS:JNJ");
java.io.InputStream is = url.openConnection().getInputStream();
int ptr = 0;
StringBuffer buffer = new StringBuffer();
while ((ptr = is.read()) != -1) {
System.out.print((char)ptr);
buffer.append((char)ptr);
}
}
它运行良好,但问题是它打印出来的HTML与我检查元素时看到的HTML略有不同。实际数据本身似乎缺失了。所以我猜它与框架HTML分开加载。那么我如何从网站上获得数据点呢?是否有某种方式我应该加载网页或什么?