标签: java html parsing jsoup
我正在制作一个小型在线平台。它包括来自不同新闻网站的新闻。 我在我的网站上使用JAVA,在解析HTML时使用jsoup解析器。
我使用简单的方法,首先我将HTML页面下载到本地文件夹,然后通过选择器和过滤器从中提取HTML。例如。 doc.select( “IMG”)
但是假设如果目标网站的设计发生变化,那么它将停止工作。 另一个大问题是针对不同网站的不同解析器。
我想制作像谷歌新闻一样的解析器,HTC新闻源。
如果有人能以正确的方式指出我。