Hw动态HTML解析器工作

时间:2014-06-14 09:15:21

标签: java html parsing jsoup

我正在制作一个小型在线平台。它包括来自不同新闻网站的新闻。 我在我的网站上使用JAVA,在解析HTML时使用jsoup解析器。

我使用简单的方法,首先我将HTML页面下载到本地文件夹,然后通过选择器和过滤器从中提取HTML。例如。 doc.select( “IMG”)

但是假设如果目标网站的设计发生变化,那么它将停止工作。 另一个大问题是针对不同网站的不同解析器。

我想制作像谷歌新闻一样的解析器,HTC新闻源。

如果有人能以正确的方式指出我。

0 个答案:

没有答案