从网页中提取文本

时间:2013-07-15 15:30:20

标签: java url html-parsing

我正在开发一个程序来读取此页面的内容:http://www.pogdesign.co.uk/cat/并在我最喜欢的电视连续剧之一以及本月的哪一天提醒我。在这个程序中,我还希望有JFrame显示所有月份(可能是JTabbedPane),并且在每个月我想要列出我最喜欢的电视连续剧的所有剧集以及该月的相对日期

我已经使用“jsoup: Java HTML Parser”编写了一些内容,以便从html网页中提取文本。 我需要了解使用什么方法来实现这些步骤:

  1. 找到特定电视连续剧集的一个月的那一天 预定并保存在某处。
  2. 获取a ref个链接 剧集并使用它们来查找每集的播出时间 将它们保存在某个地方。
  3. 那么你认为做这样的事情的好策略是什么? Java HTML Parser是否足以完成这样的程序?

1 个答案:

答案 0 :(得分:0)

首先,我建议您获取一个包含您想要查找的标题的项目列表,并在使用parent()方法(JSOUP)后一步知道所有相对日期。

我认为你可以用Jsoup轻松完成。