我想下载在给定网站上用于高级图表的基础数据。主要用例是我想对图形数据执行自己的自定义分析。
我可以使用某种webscraping api来实现这个目标吗?
答案 0 :(得分:0)
要填写你的任务,你必须解析来自html页面的数据,如果网站有一些api来获取数据更喜欢使用这种方式。假设您的网站没有api来获取数据。
要解析来自页面的数据,您需要使用库https://jsoup.org/或此列表中的模拟https://mvnrepository.com/open-source/html-parsers,之后您必须分析要解析的数据并创建数据类,如Chart
(也许您也是需要类Row
等)根据html页面上的图表中的数据,这样的事情(非常简单):
class Chart {
List<Row> chartRows;
Chart(List<Row> rows) {
chartRows = rows;
}
}
对要解析的任何数据执行此操作。 Jsoup库具有方便的功能,不仅可以解析页面而且可以下载它们(https://jsoup.org/中的所有示例)但我建议不要混合负责下载带代码的页面来解析它们的代码。使用数据填充Chart
课程后,请按照您的要求执行操作。