标签: java web-scraping html-parsing webharvest htmlcleaner
我是Java的新手,我想在网页抓取和解析数据方面做得非常好
是否有任何与网页抓取相关的网站可以帮助我理解像htmcleaner,web-harvest,htmlparser这样的API如何工作?
我仍然不够熟练使用Java来查看他们的Javadoc并理解他们的所有方法是如何工作的,并且无法在Web上找到可以帮助我的Java代码示例(教程)。
答案 0 :(得分:10)
为什么不尝试使用此库:JSoup?
食谱介绍是一个很好的起点,如果您愿意,可以直接使用其他特定的代码示例。
答案 1 :(得分:3)
您是否尝试过使用以下示例:
也许那些可以提供一些帮助?