如何从java中检索网站上的单个数据?

时间:2015-03-05 02:35:28

标签: java web-scraping yahoo-finance

我正在我的java程序中创建一个需要从Yahoo Finance检索股票价格的流程,我无法弄清楚如何做,也不知道从哪里开始。到目前为止,我有它可以连接到我想要的任何特定的股票页面,但我不知道如何去检索当前的股票价格。

urlName = "http://finance.yahoo.com/q?s=" + ticker + "&ql=0"; URL url = new URL(urlName); // Get the input stream through URL Connection URLConnection con = url.openConnection(); InputStream is =con.getInputStream(); con.connect();

3 个答案:

答案 0 :(得分:2)

您可以采用以下两种方式之一:

(1)简单方法:使用Yahoo Finance API:http://yahoofinance-api.com/

(2)困难的方法:解析价格的html源代码。

答案 1 :(得分:1)

在线播放阅读器。获取字符串中的源代码,然后分析包含您的信息的标记的源代码,使用xml解析来获取该信息。您可以在java中使用tiddy库。

答案 2 :(得分:1)

您是否特别想抓取网站进行练习?使用这样的库会更容易:https://code.google.com/p/yahoo-finance-managed/wiki/YahooFinanceAPIs

如果您确实想要抓取,可以使用HttpConnection或Apache HttpClient获取HTML,然后使用像JSoup这样的库来解析和解释数据。