以Java方式从网站读取和组织数据

时间:2012-10-18 17:29:24

标签: java html url multidimensional-array

我的项目是为我的大学建立一个计划制定者,学生可以选择课程,并为他们提供可能的时间表。

第一步IMO将从here获取大学时间表中的数据 然后将重要项目(课程标识号称为CRN,标题,部分,时间,房间等)放在某种形式的多维数组中,然后我可以使用它来处理数据并构建计划。

我的问题是:

正在使用the method described in the docs获取数据,然后将其转储到{ID,CRN,TITLE,TIME-DAYS,TIME-HOURS,ROOM}这样的数组中,这是一个很好的方法,或者我不必要地制作东西复杂?

1 个答案:

答案 0 :(得分:1)

您可能需要一个用于解析HTML的库。我建议jsoup:http://jsoup.org/

他们有一本食谱可以帮助您入门: http://jsoup.org/cookbook/

从他们的网站上读取维基百科数据的一个简单例子:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
Elements newsHeadlines = doc.select("#mp-itn b a");