我正试图从板球网站获得现场板球比分。 部分HTML源代码如下。
<html xmlns="http://www.w3.org/1999/xhtml" xmlns:fb="http://www.facebook.com/2008/fbml" xmlns:og="http://opengraphprotocol.org/schema/" xmlns:fb="http://developers.facebook.com/schema/">
<head>
<meta name="google-site-verification" content="ZxdgH3XglRg0Bsy-Ho2RnO3EE4nRs53FloLS6fkt_nc" />
<title>Eng 132/4 (29.3 ov, MJ Prior 27*, IJL Trott 53*, JM Davison 0/10) | Live Scorecard | ESPN Cricinfo</title>
<meta http-equiv="Content-Type" content="text/html;charset=utf-8" />
<meta name="keywords" content="Canada v England, Live cricket score, Khan Shaheb Osman Ali Stadium, Fatullah, Fatullah, Other one-day/limited-overs matches" />
<meta name="description" content="Live cricket score and commentary for ICC World Cup Warm-up Matches, Canada v England at Fatullah, Feb 16, 2011" />
我的兴趣点是<title>
标记。如何解析文件并检索
标题标签上的信息?
P.S。我从XML文件中获取上述HTML链接。 我打算使用以下链接中的代码来解析XML文件 并检索T
http://www.ibm.com/developerworks/opensource/library/x-android/
此致 萨姆
答案 0 :(得分:1)
您可以打开一个流来阅读网址内容,然后借助<title>
和</title>
方法在String.substring()
和String.indeOf()
代码之间提取字词(肮脏的方式)。或按照this链接说的(正则表达式)