应用错误收集

Hw动态HTML解析器工作

时间：2014-06-14 09:15:21

标签： java html parsing jsoup

我正在制作一个小型在线平台。它包括来自不同新闻网站的新闻。我在我的网站上使用JAVA，在解析HTML时使用jsoup解析器。

我使用简单的方法，首先我将HTML页面下载到本地文件夹，然后通过选择器和过滤器从中提取HTML。例如。 doc.select（ “IMG”）

但是假设如果目标网站的设计发生变化，那么它将停止工作。另一个大问题是针对不同网站的不同解析器。

我想制作像谷歌新闻一样的解析器，HTC新闻源。

如果有人能以正确的方式指出我。

0 个答案:

没有答案