Question

基本上，我需要一张包含所有可能存在的书的桌子，而我不想这样做，因为我是一个非常懒惰的人xD。所以，我的问题是..我可以使用一个我想过的网站，就像切断该网站的其余部分（不需要的）并只保留搜索部分一样（可以在其中进行某些更改）版式...），然后进行搜索，查找书籍并将仅对我有意义的数据存储在我的数据库中。那可能吗？我听说JSOUP可以提供帮助。所以，我只想要一些技巧。（阅读时要谢谢）。

网站：http://www.isbn.bn.br/website/consulta/cadastro

Answer 1

是的，您可以使用Jsoup做到这一点，主要问题是共享的URL使用JavaScript，因此您需要使用Selenium强制执行JS，或者还可以获取书的URL并对其进行解析。

使用Jsoup解析Web的方法是：

Document document = Jsoup.connect("YOUR-URL-GOES-HERE")
                         .userAgent("Mozilla/5.0")
                         .get();

您将在文档中检索整个HTML，因此可以使用CSS选择器获取Element中包含的任何元素，例如，如果要在HTML中检索网络标题，则可以使用：

Elements elements = document.select("title");

，对于您要从中检索信息的每个HTML标签。您可以检查Jsoup Doc并检查一些解释的示例：Jsoup

希望对您有所帮助！

使用JSOUP从另一个网站获取数据

1 个答案: