基本上,我需要一张包含所有可能存在的书的桌子,而我不想这样做,因为我是一个非常懒惰的人xD。所以,我的问题是..我可以使用一个我想过的网站,就像切断该网站的其余部分(不需要的)并只保留搜索部分一样(可以在其中进行某些更改)版式...),然后进行搜索,查找书籍并将仅对我有意义的数据存储在我的数据库中。那可能吗?我听说JSOUP可以提供帮助。 所以,我只想要一些技巧。 (阅读时要谢谢)。
答案 0 :(得分:1)
是的,您可以使用Jsoup做到这一点,主要问题是共享的URL使用JavaScript,因此您需要使用Selenium强制执行JS,或者还可以获取书的URL并对其进行解析。
使用Jsoup解析Web的方法是:
Document document = Jsoup.connect("YOUR-URL-GOES-HERE")
.userAgent("Mozilla/5.0")
.get();
您将在文档中检索整个HTML,因此可以使用CSS选择器获取Element中包含的任何元素,例如,如果要在HTML中检索网络标题,则可以使用:
Elements elements = document.select("title");
,对于您要从中检索信息的每个HTML标签。您可以检查Jsoup Doc并检查一些解释的示例:Jsoup
希望对您有所帮助!