我正在尝试创建一个java程序,可以从BBC网站上读取和输出橄榄球队在联赛表中的位置。
到目前为止,我已经找到并使用了这段代码,它显示了所有的HTML。
URL oracle = new URL("http://www.bbc.co.uk/sport/football/premier-league/table");
BufferedReader in = new BufferedReader(
new InputStreamReader(oracle.openStream()));
String inputLine;
while ((inputLine = in.readLine()) != null)
System.out.println(inputLine);
in.close();
但我想搜索HTML以找出哪个团队处于哪个位置。例如,这是我对HTML代码
感兴趣的一点
但我不确定如何搜索它。我一直在看正则表达式,但我似乎无法找到使它运行的方法。
答案 0 :(得分:0)
您是否查看了解析HTML的Java库?请查看jsoup或HtmlCleaner,作为this SO问题的最高投票。两者都在积极更新,最有可能满足您的需求。
与手工制作正则表达式相比,如果他们决定在将来更改标记,那么您还可以更轻松地更新代码。